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1 :iSI3SKnTTGTGCACTAT^ 
101 ^AAACTATArrGTGTAGTATXAATAAGCTATGAA^ 
201 AAIAACTTCGTTC7AATTCACTATACACAACT 
3 01 AATCATTTCCnrCCAAATTACCGriXn*ATAAATTC^^ 

joi S^=?='J^»S«=f=f™ 

801 ATgCTgTTACTAAATCTAAAmTTATACCATTACTft^^ 

136 AVTKSKDYTITSKILSKPVMVEHEL V N 

50i ^T^^^f-GCAtbr;^^ 

169 I-SQVS 3KLEEILYNTSNVVDEYVRSLPN L I G QV 

202 LYFNaVKKSEALSLFLNIHASYYSKWIQADN D T S 

1101 CAGTACTCCCAAGTTGCTCTACCATAGCTGAAGAAATGT^ 

236 VLPSCSTIAEEMCDHPDYARLVDIPSNKY EL N L 

1201 TATTOTAGTTTACCAGCACC^^ 

269 IVSLPAPaKPKGKPEEHSSSQSQICKNSKSRKRN 

STOP PM < 

13 01 AAGAAACATCCAAAATCAGATAACGATAAAGGTGAAAAAGAAAAAGAAAAAGAAAAAAC^^ 

302 KKHPKSDNDKGEKEKEKEKTSSS-KTGAA V I 
PSEDDOIOJOT --..>. 
1401 TAATGAATAimTAATTGCACeA^VACCACGTTTCCAGT 

336 MNIHNCSKTTFPVENSHSLNASLNVMNFKGLR?. 

1501 TAACAAGrATCTAGrGTATGATACTQGTQCXaCAArrA'r^ i^'i'ltalXAACaATAAAGATA-boTGCTOUlTSTT^^ 
369 NKYLVYDT GATI SVVNNKDILSNVKDATIEV S V 

1601 GCTGATGCrrGCTACATTAGAAGCAGATTGTATTGGTGATCT^ 

402 ADGATLEADCIGDLIIRVGIVSITLSNTLYLPES 

1701 ^^ll'w^.-i-i-AATC:':^lXjAGTTTGAAACAAATTGAAGAACGAGCarrrAAT^^ 

436 SFNLVSLKQIEERGFNVLITKSSVIVFNQNV T* P 

1 801 TACTATTATTGCrrCaAGGAAGAATGCTGCTGATCTT^^ 

469 TI lASRKNAADLYMGPQFSEESLECDFDYDGLA 

1901 GATATGTTGTCCAATGCTAACCAAGATGACAAAGATAAATCAAGTATGAAT^^ 

502 DMLSNANQDOKDKSSMNEMSEYQEHDYSSRALIN 

2001 ArrciTTGACGGACGTTGATGTTTTAGATtTrTGAAAT^ 

536 sltevdvlVdvei-spygveqllptgdkndiyn f ir 

2101 TTTGATGTCAAATCfl.TATGTCCATTGAGAAA Ai L i lll^ri 'ACAAAAATACCAGGGTCTCGTACrTCACTlCTrCAft^^ 

569 LMSNHMSIEKILLLQKYQGLVLHTSKESLQKir* 

2201 GATTGTAAGGTATGTCTATTATCGAATGCCAAACAGAGAAGTCACAATCA 

602 D CKVCLLSNAKQRSHMHHSERKASRRHERLHC D T 

23 01 CTCTCGGTCCATTTAGGTCCGAAAATAACAAGTGGTATTTAA 

636 LGPFRSENNKWYLTSV IDEHTGYIEGIITKDRK 

2401 . GGTAAAGGATCTCTTAATTCaACGATTAAAGATCTC^ 

669 VK-,DLLIQRLKIWNNRFHDKVAYFRSONAPEFPQ 

2 501 CCTTCTGATTTACCTGAGTTCGGTATTTGGAGGGAGACTATAGC^^ 

702 PSDLASFGIWRETIAAYSPELNGLAEVVNKLI*L*Q 

2601 AACAGATTTACAGGATCGTTGTGACACTTGGT^^ 

736 OIYRIVVTLGPQILKLIYYVIQYSITMINHTPR 

2701 TCGTT=ACT»ACGCACAAACCCCTTATGGTTGCTATTAfcAATTAAff 

769 RSLKGQTPYGCYYQLSEGNFYRFPFAIDCVVTF 

2801 actaatgccatcgaaaagaacccttacgcyuntacatcaactaaaggagm 

802 snaieknrygvtstkcapssimgavigyasdcf"s 
2901 gttattacgtgttgctaaaaaatatgcggto^tattatcc^ 

936 VYVLLKNMRCDIILSPNVRILRSYEVINSYLKN 
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3301 «^;«^^^^TCC.W=«^ 

3401 CrrAATAGGGAAGTCTAAAGAGCCTATTACAAACCAaur^^ ir-^^^,,,^-. I. 

1002 V I a K s K E P I T N H T K D A % s TTTTT^^'^rf^T^fTTTl 
3S01 ^TTTT^fTTT^ftTTTTTT^rr^^ 

3301 ^^^i'^-^'^-f^fTT^^ 

3,01 ™^™^^^»j*^Ta.T*iT«AC^ 

jool r?-t^-xj«^x.=^^x.^^ 
«oi T^f^-^Tf^f*^"^ 

«oi i»f^-^7=ps^-™-^ 

4401 AGTCACCATATGTTACAAGAACrroGTAGAACGm 

1336 SPYVTRSGRTVINPKRYLHA 



V V N K 



ATCGACTATAATGATCCGGGATGGAT 
IDYNDPGWI 



J501 -^-^^YTTf^tirrrf^r^ 



4601 CATACIXaGAAAATTGATTCTCTCAA ^ 
1402 HTEKIDSLKGVV 



ATTGSATTATGACCCTTTTA 
KLDYDPFS 



va^yvi DLVTIRLLTlIGCELGMTlQHLDVESA 

jsoi "'fYTTT't^t^^T'S^'TTTTl^ 
«oi r=?-=tTTTTTT^*Tt^'T^ 

5001 TTCACATTGiMftTOAAGJ^Ta^ 

niEI.ECSVIYLGLYVDDlLHVGSSQKVIONFV 
SlOl <^TCA;^T^a^r=AITriGAA^A^^ 

w***vunir tVKVFGEI SNYLGIEFaKTSSGyiLS 

5301 =»*'*5™^J*Tp=.^T^TTTT^^ 



5401 
1659 



'ATGGGCTGCCjpAAC?^^ 

GSLLWAAT.NTRPDISVVVNSLGSKSANPNVH D Y 



17g2 EKi.IYCLRyiKNSMGYHIEyKRNRLNIPPKSF V I 

5601 --^-f^T^ 

5701 ^^J-f-^'^^ 

-du-£ OUGFSVGKIHCHQDNQAVIKVLRMNYCHPHRPID 

5901 ATAt^ATAAGTTrpicGCO^ 

AflJO "^^^^f^^IlQ^INDKVFSISYVKTNaNYADCWTKC 

6001 Y't^'l^^f^P^ 

iBbS i*5RAKFKAFVEG RRLDLEDNQTSIQUAITAE 

6101 TAAGTGGAT^ATCATTACTArrATCGTA^TGCTCAATcJS^ 



6201 TTATGAGAATGGAAAATTTTTCCATCACACJ^T^^ 

■ TATA POLY A 

6301 TAraACGAGATAGAAGGCAGGACTrrCAa.TATATATCTCT^ 



6401 



AGGTAAAGAAACTTTATAT TrrftTrA 6426 
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S, cerevisiae tRNA^^S^ 

1 

3 9 UCUG GGUAAUGCGGUGCGCUCG - 5 

3 • -CUAAUCUUCAG CGC A 2i,c 

^ , ... I I I I I I I I I I I I I I I I I 

pCal RNA 5 • . . , UAUUCCATJPAGAUUAGAAGUC GCGUUGUAUAJiJVUUCAGUCCU . . . 3 ' 

G A 
UGAUA UUAAA 
G c 
AUAAUCAUUUCGUCC 



Teal PPT: 
pCal 3' PPT: 
pCal internal PPT: 



GAATC-AGGG-AG 

INI MM M 

AATC-AGGGGAG 
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Protease 




Integrase 


(zinc finger) 


1731 (268) 


TQWCLDSGATSHMC 


1731 (397) 


HKRNGH -28- 


CKTC 


copia (287) 


CGrVLDSGASDHLI 


copia (419) 


HERFGH -30- 


CEPC 


Tntl (292) 


SEWWDTAASHKAT 


Tntl (426) 


HKHMGH -25- 


CDYC 


Tyi (456) 


GHLLLDSGASRTLI 


Tyl (599) 


HRMLAH -32- 


CPDC 


Ty4 (410) 


KLVIIDTGSGVNIT 


Ty4 (562) 


KKHMGH -29- 


CQTC 


pCal (370) 


KYLVYETGATISW 


pCal (568) 


KLMSNH -29- 

* ^ tr 


CKVC 
* * 



Integrase (continued) 

1731 (518) KIKCIP^NGGEFVNNVFDDYLKAHGIARQLTIPHTPQQNGVAER^^^ 

copia (543) KWYLYIDNGREYLSNEMRQFCVKKGISYKLTVPKTPQmGVSER^^ 

Tntl (543) KtiaU.RSDNGGEYTSR£FEEYCSSHGIRHEKTVPGTPQHNGVAZr^^ 

Tyl (729) SVLVIQMDRGSEYTmTI^-iKPLEKNGITPCYT^ 

Ty4 (689) KVREINSDRGTEFT^O;2IHEYr ISXGIHHILTSTQDHAANGRA^ 

pCal (687) KVAYrRSDNAPEFPQPSDLAEF. . . GIWRETIAAYSPEmGLuaJEAA/NKLILQQ 

^ ^ * ^ * ♦ nr ^ ^ ★ /s- •»N » y\ 

Reverse Transcriptase 

HHMDVCTAYIJ^SEL. .KDTVYMKQPQGFTDAANPI^ -32- ILVYVDDLIL 

HQMDVKTAFmGTL. .KEErhfMRLPQGISCNS. .DWCKLN^ -34- VLLYVDDWI 

EQLOTKTAFIiiGDL. .EEEIYlffiQPEGFEVAGKKHMVCKl^^ -33- LLLYVDDMLI 

TQLDISSAYLYADI . .KrTfTr.YIRPPPHLGM. . . NDKLIKLKKSLYGLKQSGANWY -29- ICLrVDDMVL 

KTLDINHAFLYAKL. -EEEIYIPHPHD RRCVVKLNKALYGLKQSPKEWN -30- lAVYVDDCVI 

QHIJDVESAYimSITHSNPIYVrPPKSVPL. .KKl^CWLI^^ -33- LGLYVDDILM 



AFTGFVDADWGGDKLDRKSYTGYV 
KIIGYVDSDWAGSEIDRKSTTGYL 
ILKGYTDADMAGDIDNRKSSTGYL 
KLVAISDASY . GNQPYYKSQIGNI 
KVIAITDASV . GSZYDAQSRIGVI 
VIECESDASFAPG . LDRKSISGTL 



1731 (880) 
copia (999) 
Tntl (919) 
Tyl (1343) 
Ty4(138I) 
pCal (1461) 



RNase H 

1731 (1129) 
copia (1 247) 
Tntl (1174) 
Tyl (1604) 
Ty4 (1639) 
pCal (1734) 
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CfT-I: Cladosporiumfulviim 
Tfl: Schizosaccharomyces pombe 
Syp^Y' Drosophila melanogaster 
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17.6: Drosophila melanogaster 
Tom: Drosophila ananassae 



- Ty3: Saccharomyces cerevisiae 
HIVl: Human immunodeficiency virus 
RSV: Rous sarcoma virus 
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MMLV; Moloney murine leukemia virus 

Osser: Volvox carteri 

Tal: Arabidopsis thaliana 

Tntl : Nicotiana tabacum 
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Tstl: Solanum tuberosum 

Hopscotch: Tea mays 

Ty5: Saccharomyces paradoxus 

173 1: Drosophila melanogaster 

— copia: Drosophila melanogaster 
pCal: Candida albicans 

Tyl: Saccharomyces cerevisiae 

Ty2: Saccharomyces cerevisiae 

Ty4: Saccharomyces cerevisiae 
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non-LTR retrotransposons 




FIGURE 8 



27 37 27 37 27 37 27 37 27 37 27 37 27 37 



FIGURE 9 



C3 
=P 

MJ 
C3 

in 
m 
I* 
ru 



SCY-I 

SCY-2 

SC5-1 

SC5-2 

ATC-I 

ATC-2 

SA4-I 

SA4.2 

FI6-1 

F16-2 

759-1 

759-2 

p30 

p36 

SGY-I 

SGY-2 

SC5.1 

SC5-2 

ATC-1 

ATC-2 

SA4-I 

SA4.2 

FI6-1 

F16.2 

759-1 

759-2 

p.10 

p.H 

SGY-I 

SGY-2 

SC5-1 

SC5-2 

ATC-1 

ATC-2 

SA4-J 

SA4.2 

Fi6-I 

FI6-2 

759-1 

759-2 

p30 

p.16 

SCY-I 

SGY.2 

SC5- i 

SC5-2 

ATC-1 

ATC-2 

SA4-I 

SA4-2 

F16.i 

F16-2 

759-1 

759-2 

p30 

d36 



T GTlOo 'i iiC l( jCflCTAriTlt:irGI CA GAAACTGATCAATGAAAATGATGGTTATTATC^ 100 



ACTAAACTATATTCnxn'AGTATAAATAAGGCrrATGJJATACCAACATCCC^^ 200 

^ G , 

: G 

TA 

TA . 

: GA 

GA 



AATAA LlUt-U ' i - l ' wl ' A ATTCACTATACACAACTAGACGTGTACACGCTCAATCIXZAGGTAAA^ 300 



-A.A. .C. 
-A. A. .C. 



.A. A. 
.A.A. 
.A. A. 



CCAAATTAGCGTTGTATAAATTCAGTCC: 



ATACrrTTCGCywrrTTGAAGGTACAGAATTTC 392 
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C albicans iRNA'^ucu fragment 



C 
G 
□ 
C 
C 
G 



- stem-loop 
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^UUGU AAADUC^U CCU CAGAUUU^^AUUAUU ^ A 

MM M M M M Ml M : I : M I : M M 
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EcoRI 0.40 
^Sacl 0.40 
\TG 0.80 




Hindlll 
SphI 



SphI 

PstI 

Sail 

Hindil 

Xbal 

BamHI 



TAA 7.47 
(Nsil/PstI) 7.44, 
TAA 7.43 

EcoRI 6.75 

(Nsli/PstI) 6.48 

ATG 6.17 

Cell! 6.13 
EcoRI 5.86 




iJii'. LacZ 
^^^Amp LTR 

'"^ ORi 
Lac I 

pRPUS 

11.47 



sti 1.30 
indll 1.57 
GA 1.77 




Asp718 3.79 
Sail 3.98 



Styl 5.06 
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FIGURE 17 

>retrotransposon_l 1309bp LTR kappa: 698-977 

CTGGATAAAGAAATCAGAAAAGAGATAGCAGGAAAACCAGGAAAAGGTGACGATGATGACGACGACAGT 
TGGGGATCTGT 

GCCTGTTTCAATTCGAGTATTTGCTGAAGTTGAAAAGAAGTTGAAGCAAAAGAAAAGTTTGGCATCAAG 
CTAGATATTTA 

TATATGTATATGATTAGACCAACATAAAACTAGACGTCCAAATATTTATTTATTTATTTATTGATATAT 
ATTCTTATTTA 

TTACTGTTATGATCTTTTGATTCACACAGAGATTTAATCCAAATCAATACCTTTTGTTTTGTAGAAATC 
TTTTGCTTCTT 

CAATTTGTATTTTCAATTCTTTGTATTTATGTTCTTTGTCTTTGAATGTAACAATTCCCCAACCTAACG 
TTGATAAGGCA 

TAAGACCCAAATGTGACTAATCCCCACCATGGCAAGTATGGCAATATTTCATCGTGTATTTTAGCTGGA 
GTTGGAATCAC 

ACCTGTGATAAGAGCAAAATAAATAGCTGATAAGGCAAAAATTGTTAATCCTGTTTCAGTAGCTTTAGT 
CATTCTTATAG 

TTAGACTTGTTAAAGGGTAGTTGTGTTAATTGAAGATATGCTGGAAAACTATACTTTTCGTTGTTTTTT 
TTTTTCAATCT 

AGGTCGGGTGTGCTGTTATTTTTTTTCTCTCTTCTTGGTTCTTAGTATTGGATTATATGTTGGTTTATG 
CGACGTTTGTG 

TCAGGGAAATAACACCTTGATATAAGTCGTGCGTATTAGGTCAACATTGGTGAAAAATTTGCACTCATC 
GAGAGCCAGGA 

ATTAGTATAAAAAGAAGAGAAAAGAAAGATATTTAGGATATTTATTATATAGGGACCGAGTTTCAGGAG 
ACACTTTTAGT 

GGGCGTAAACTTCATTCACTCTGTTTTTTGCTTATTACAAATTATCACCTATCGTGTACTAGGACTAAT 
TCTCACGAATA 

TTCCGTGTATACAAACACTTATTGCCAACTTATGGTGCGGAACTTTATTTGTCTGAACCAAAATCAAAG 
TCACATCATTT 

AAATGAACGTTGACATAAATAGATTCTTTATTCAATAGAAACAATTTCTTCCTTTNTCTTTTCTTTGTA 
TTANTGGTTAG 

ATTTCCATTCCATATACACACAAGATGTCAACGAAATCAGCAAATTCAACTGCTGTCAATTCATTTAAT 
GCAAACCACTC 

CAACTATGACGTTTTTAGACCTTCATTCACCCCAGTTTTGGTCAATACATTCTTAGTACATCTTGGATT 
AGCTACGAAAA 

ACCCAGATGACACTTTCACTTTTGACATA 
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>retrotransposon_2 1340bp LTR kappa: 770-1047 

CCCNTTTGTNTGGTACATGTTAGACAGGCCCAAAAAATGGTATCATTTAGAACTGTATGGAGAACATTA 
GTTTTGGTCCA 

ACATTGCGTGATGATGGTATNTNTTTCGTATTATAGTACAATGATGGCTCAATGATTNATTTTAGGTTT 
ATATGTGGATG 

ATATCTTAATGGACAGAATCTCAGATGGAATCGTTATCAGATTTGTTGAACAAGAGAGAGTTTATTTCG 
CGTNAAAATCA 

ATTTAGGTCTCATGACAGAATATGTGAGATAAAATGTCCACGTAAGCAAAACTGGGTGATACTNTGAAT 
TAAGAGATACT \ 

CCTAAATAAGCAAACCAAGGATNTTAAACTACACAANTCGTATGGTAAAACGTGCTTTGAGTNCCAAAT 
GATAGATGCGA 

GATACCAACAAAATAGNACTGTCGCAAATGCTGAANACAATTTCACTGAGGTTCGAAATGNAAAATNAC 
TTAANTCAATT 

AAAAAATTTATACCAAAAGGTGGTCTGGAAGTGCTGATATGAACACGAAATTTAANGCATTCTGTGGAA 
AATTCGTTTAA 

GCTCACANTCGGAAAATACTACCATTCTACATTTGCAGAAAATTAAAATTGTGTTGTGAAATATCTACA 
TCCTACAAAGT 

TCAAGACATTTATTGATGGTATATTCAAAGGACTCGATGTTGAGAATGATAATAACCTGAACCAAGACG 
CTACAAATGCT 

AATTGAGTAATTCGTAATTGCTAAACAACGCCATTTCGAATCAGGGGAGTGTTGGTTTATGCGACGTTT 
GTGTCAGGGAA 

ATAACACCTTGATATAAGTCGTGCGTATTAGGTCAACATTGGTGAAAAATTTGCACTCATCGAGAGCCA 
GGAATTAGTAT 

AAAAAGAAGAGAAAAGAAAGATATTTAGGATATTTATTATATAGGGACCGAGTTTCAGGAGACACTTTT 




AGTGGGCGTAA 

ACTNCATTACTNTGTTTTTTGCTTATTGCAAATAATCCCTATCGTGTACTAGGACTAATTCTCACGAAT 
ATTCCGTGTAT 

ACAAACAAAATCAGACTTCTTGGTAAGCCCAGCCGAAACAGCCATACTTCTAGTGGATCTTTCTATACT 
ACAACATTCAC 

ACTGCTTGACCTACAACTACACATATTCCTTGTTATAAGGGCAATCTATCACACAAAAGATTTACTGTT 
GACTCACAAGA 

TATCAACTGTACTAATAAAGGAGTGCATTCTATGACCTTTGGAGAGGAACTATGTATAATATAAGAGAG 
AAGGGACTAAA 

GATCTATATATAATGAGCAGGATGGGTAACCCGGTGGGGTATTAGCACGCACACGACCTG 
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>retrotransposon_3 556bp LTR kappa: 1-216 

CAACATTGGGTGAAAAAATTTGCACTCATCGAGAGCCAGGAATTAGTATAAAAAGAGGAGAAAGAAGGT 
ATTTAGGATAT 

TTATTATATAGGGACCGAGTTTCAGGAGACACTTTTAGTGGGCGTAAACTTCATTCACTCTGTTTTTTG 
CTTATTACAAA 

TTATCACCTATCGTGTACTAGGACTAATTCTCACGAATATTCCGTGTATACAAACATTATACGTGTCTG 
TAACTACGCGA 

AACTACTTCGTCTCAGTTTTTTGTTACAAACAACTTTCCGTATAGACCTGAGATTTTGTCAGCTTGATT 
GAATGGAAGAG 

TTTACTAAAGTACCAGAAAGGTGTTTTATAGATAACATGTAGATATATAAAAATGTTATATTACAAATG 
ACTTCCAAAAG 

AAACTGTACGAATTTTGCTGTTTATTAAAAACCAGTTCCTGAAAACTAGTATCTTAGCTTCAGTACATT 
TAGCCCACCTA 

AATTGGACCTATGACAAGTTCTACTTTCCCGACAATGCTAATATAGAGCAGTTTCTTCTTCTTCTTCTT 
CCTCGTC 
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>retrotransposon_4 2112bp Tcal-like LTR: 221-608 

ATTTAATATGTTGGTATTGGCTACTGCCAACTTCTTAGCTGATGCAGATGCCATTGTTAATATTGTTAA 
ATTGGGTAAAT 

AGTATGAAGGAAGCTTTGGCAGGCGTTGTTATTTTTTTCACCAATTATTATCATCACCTGCGGAGGTTA 
GTCAATTTGAG 

ATTGTGCGAGGGAAAAAAAACGACCTCCATACACTACCTCAAGTATAAGTCCAGTCCAATTGTTCGCTA 
TAGAGAGATTT 

CCTAGCCGGAATGCACGACAATCCTGAGACGGAAGTCGATCGTCGATGCCCATGGTGCGTGGTGAAAAA 
TTTTCTTAGAA 

AATTTGTTCTTTCCTTCAACTGCTTTGAAGAGAGGGAGGTTCAAGTGGTTTAAGTACGACGGTCACAAA 
GATTGCGGCTT 

ATGAGGCCCGAACTGAGTTGAAATACAAAATCAAGATATAATTATATACCTTACTTGTCTATATTGTTT 
TATAATACATT 

CTTCAGATATTTAAATTTCTGTGTATCATCCTATAAAACAGAGATACATTCAGTGCATTTAGTATACTG 
AGTGAACTGGT 

ACCTGTGACATTCAAGATAACTGTTTCACGCACGCTGGCAGACGAACACCAATAGTATGATGAAGAACT 
GACCATGGTGT 

AAGAGGTTTGATGGAGTTTCTTTTTTTTAGAAGAGGTTGATAAGCCAACAGATGAGGAGTAACAAGTAA 
CTCGCAACATT 

GTATAACATAAGTTTACATCAAATCAGAATTTACTAAGAAAATCAATCCATTCAAAAGGCACTCAATCA 
TTGAAAAAACG 

AGCTTAATGAGTAGACGGTCTGTTCATATGAAACAATTGAAAGGGTTGAATATTGTTTGGAAAATTATA 
TAATTCATGTC 

AAACTGGGAGGCTTAAATTATGGTCACTCCACAGATTATGAAACGTAGTTACACAATTCTTGGACCTGG 
AAATCCCACAA 

GAGAGCGTTAGTTAGTTTGCACTCTCCTCACCAGTTAAACTACCCATGATTCTCCAATGTGGCTTATTT 
AAGTATCAGAC 

AACAGATACATGGTTTCCAAGTGGTCTCATTTTTGGTTTACTGGAGTCTGCATTCCCCACAAAAGTACC 
TTTCAAAACTA 

ATTAATGTAGCTTCTATTTGATAGCCTCTGTTATGGAAATAGATTTGCTCTGCCCAGTGGGTGTAATTA 
TTCCCAGCTGG 




AACTATTCCGATAGATATGTTTTAATGTCAATTTAAATCTTGTAATAATAGTAAGGATGCGGTTTATCC 
GCGATCTTCTT 

AATACCTGTGGAGTTACTCCAGAACAGAGGTTCAATTTTTTCTTGGTTGGTAAATTATCCGAGTAACAC 
GGGGTAGCTTG 

GTTACTCCAGTTGAGAATGTAAACTATAGATGAAGATTTCAACACGCAATTATTACCCCACCTTGGCGA 
ATTACTAATCG 

ACTATTTGTTAATCCAGAAAAAATTATACACAAACACTGCCTTTTTTTAAAAAAAGCGTTATTTTGATG 
GAACGATAATT 

AACGATGGTTCTGCACAAAAATGTGGTCCAAAGCCCCAGACTATTCTGAAGTATGATTTGTTACTTAAT 
TTAGTGAATAA 

TTAAACATAAAATCTGGAGAAAAATTTTTTTTTTGCTCTCATGACCAGTGGCAAATTCTTGGTAACGAG 
GCTTAACATTA 

ATCCGCAAATTACCTGGCAACAGAGAAAACACCCAGAAAGTTCTGTCGTATGAGAAAACCTACAGTTGT 
TTCCGATTTCT 

CCGAGCACTAAACATAAAGAGACCAGTAATGCTAAAAAAATTTTTATTTCTGCATTACTGTTTTTAGCA 
AATACACGTCT 

AATTTATTGTATTTGTTAAACATTCTTTTCCTGAAATTTTAAGAAAATGTTTTGGTTTGTTGGAATTCC 
ATTTAAACGGT 

ACTTTGGGGTGCAGACAGCAATCCATTTGGAGAGTGGCAAGTCTACACGAATTTAGCTAAGGTTCACTA 
TATCGTGTAAC 

AAGAAATTTCTATACCAAATAAACAGCACTTGATTGAACTACAATATGTAAAAACTTGCTTTTATTACC 
AGTCTTCATAC 

ATACCCCGGTCTTCTCTTTTCAATATTCTGTA 
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>retrotransposon_5 3742bp Tcal-like LTR: 2443-2830 

TTAGAAAACAGGAAACAGCAATAGAGAGCAATAATTGAAAAATAGTGTTGTCAACAATAGAACAAATTG 
GTCAAACTTTA 

AATGCAAAACATGAAATTCCCAATTTCCAGAATAAATAATATCAGCATACATGGCCCCGAAAACTACTT 
TACCGTGTCGC 

TTTAACCCCCCCCTTCCTAAAACGAGACAATTAGACATACATTCCACAATTATCATAATCCCCTTTTTT 
TTCCTTACAAA 

ACACTTTATTTTTGTCGTTTTCGTTATTTGCTTCGACGACATTGTAAACTCTTTGGATTTGCAGTAGTA 
GTGCTCCTGGT 

GTAAGGTGGGTTTGGTTGTAGAGTAAAAGAAACGACAATTGATTACACCTCGATATGCATACGCATGGC 
AAAGAGAATAC 

CGAGTTAATAGTGAGTCTATTAGTGTTGCAGGAAAAGTTATACGAACAACATTTTGTTTAGTGTGGATA 
TTCCAGATCAA 

CAACAATATGACTAAAATCATAGCTCTAATTTTCAGTTTACCTTTGTTTATTACGATACTGCCACAGTC 
GTGCTGTACCA 

GGGTCAGTTTTAGAAAAACTATTCTAGAAATGATGAGTAGAAATGTACTATTATGAGCAATATTTCAAA 
AAGTGAAATTA 

TAATTGCTGCTGACAACACCAACAATACATACAAATTTGGAAACGAGCAAATCGAGAAAATTTCAATCC 
GTTTAGCAAGT 

TGTTCGTTGTCGTCATTGTCGATTAGTTTCAGTTTCTAGAGGTGAAATTTTCTATGGCACCAAAACCAA 
AGCCTCAATTT 

TAATTTACTCTGTGTGGTACAAAATACATTAGAGAGGATCCTCTCCAAACAGGATTGCAGGAAGTTTTA 
CACGAGAATGA \ 

TTTACTACACGACGTTGAATTAAAAAGCTCAACCAGTTTGTCAGCAATTTTGTTCTATCTGTTCAATTT 
CTTGTATAAAA 

TAAAGCAATATGAGAGAGCATCTAAATCAATAATGTCAACACAATATTAAACTTTGAGAAGGATTGTTC 
AACAAAACAAT 

CCGATGAATAGAAGAAGAATAATATCAAATTGTTCCTGATTGATTGTTGTTATTTATTTTTTATCTCCG 
AATTCCTGCAC 

AATGGCTCAACAACAGCCAACACGGATCACACATTAAATTTTTTTTTCGTGCAGGACCCCGTGGTGGTG 
GCTGTGGCTGT 

GATTGTGATCATTGTAGTTTCTGCCTTGATGATGACAAAAAATGATAGAGTTCAGTATGAGGAAGAAAT 
TAAGCGATATC 

GGTTTATGATGTGTTTAGTTATTAATTGCTCTCAATGGTTTTCAACAACGTATACAAAACTGGTGGTGC 
TTGAAACGAAT 

GAGTAATACAGATCTAATTAAGCTGTGATTTTCTAAGTTTGCCTTGTCTCTACAGTTCAAAAAAAAAGA 
ACAGAACACCT 

CAGAGGCTGTTGTGATGCAATTTTTAGGAACCTCAACAACAACCACTGACTGATCTAAGCCAGCATCTG 



/8M 




TTTAATGGGTT 

TTCAAAAAGAATGGGGCAAACGGGGAATTGAACCCCGGGCCTCCTCGAATTTTGTGTTTGGTGAACAAC 
CCAAACGAGGA 

ATCATACCACTAGACCATTCGCCCAATTCGATGACTTGGAATTATTCTAGTTATTTTTGACATACAAAG 
CTCAGCTTTAT 

TACAGATAGTCATGTTTGCATGGATGAATTAGTACTACTAATAATATAAGAAAACTAGTTAATTGGAGT 
CAATGTCTTAT 

ACATGTCTTCTGATGGGTTATGCATTGATTAATTATGAATTTCTTTTAAATACAATCTATTGCTATTAT 
TTGTATGTAAA 

ACTTTACCCAAAAACCAACAAAAAAGAGTGGTCTTGGATAAAGATTAAAGTAATTCCAAAAAGATTTGG 
TAATTAGCTAT 

ATTGTTTTGACGTACATCTATAACTACAAATAGCCATTCAGTTTGATTATGTATATTGACATAGTTGGA 
TTTGTAATTTC 

TGTTAAAATGGAAAACCCTAATCAAATGTATATGTTGAATAGGTAGTTAAATTGTACAACCTACTACTT 
GTTGTCAATTG 

AATTCAGAGCCAATACTTATATCTCCTGGAAACTGATACACAAACGAATTGTTAAACTATAACACTCGA 
CGTTCACATCT 

AAGGATTCATCGTCGTTAAGATTTATACTCATTAGCAAACTCACTTGCCATATTAAACACTTCTCAATC 
TATTTCCCACA 

ATCCAATTAATCAGCACGAAAACTAAGATACTATATATATCTGCCTATACCTGATATACACATGGCACA 
TGGCGTATCCC 

ACAAAAAACCGTCAAGACAACACCAATATGACAATGCCAATTATACAATTGCATATACCACGTGACTTC 
ATTTTATGGTC 

ATGAGAAATTAACTTATCATGGGGTTAGGCGAGAATATCAACTGTTCGCTATAGAGAGATTTCCTAGCC 
GGAATGCACGA . 

CAATCCTGAGACGGAAGTCGATCGACGATGCCCATGGTGCGTGGTGAAAAATTTTCTTAGAAAATTTGT 
TCTTTCCTTCA 

ACTGCTTTGAAGAAAGGGAGGTTCAAGTGGTTTAAGTACGACGGTCACAAAGATTGCGGCTTATGAGGC 
CCGAACTGAGT 

TGAAATACAAAATCAAGATATAATTATATACCTTACTTGTCTATATTGTTTTATAATACATTCTTCAGA 
TATTTAAATTT 

CTGTGTATCATTCTATAAAACAGAGATACATTCAGTACATTTAGTATACTGAGTGAACTGGTACCTGTG 
ACATTCAAGAT 

AACTGTTTCGCGCACGCTGGCAGACGAACATCAACACTGATCATTTGTTTTTTTTTTATTTCTCCTTTT 
TCTCCTTTTTC 

TTTCTTTTTTCTTCTTTCTTCAGACGTTGTTGATTTATTTTATCGACAGCATCCTTTTCTTTGGCCACA 
TATCCAAGCGA 

TATACTGGCCAAAGCGAAGTCCTTTTATAAAGCAATGCTACCAAATGTAACAGTTCGAGGTCAGAAGAT 
TAAGCGGGTAT 

GTTCACACGGATATTTTATGGGGTATCACTTGTACCAAACACTTTGATACGATAAGAATATTTGTAATA 
CTAACTTCAGT 

GTCTTTCATAATCAGCTCATAACCTGTTGGAATTTAAATTCGTATGTTGTTCATTCAAAATTTTGATAA 
ATGGGACGAGA 

AATCATCGTTGCCTCCTAATTAGATTATGACTTAGTACTAACTAAACTGTTTATCATTTTTTAAAGCGT 
TGGGCTCCATG 

TTAGAATAGATTATTAGGGCGGTACGTATTTCATAATTTATATATAGGTACTTATTTTTACTAATTTAT 
TGCACAGGAAA 

AGATAAAAGGTATCGATTATACCTATCAGCAAGGTTTAAGCAAAATGAAGTATTTTTACCATATTTTTC 
CATTTTTATAT 

AGATACATCAAGAGGTTTATTTTAAGTTCACCTGGATAAACCATTCAACTAACCCAATTGAATTGAATG 
ACAATTTGATC 

TCCAAAGAGGGATTCATTTCTATTCTGGAGAGATAAACGTCATTGTTTAGGAAAGAGCAAGAGATAAGA 
AATCTTTTGTA 

TATTGTATATATATTATTAATGTTATATTACACTATTGTTTGTTTGTTTGTTATAATTATATGTGAGAT 
TTCATATGTAA 

GATGTTGTTATCTCTTTCCATTATTTAGCTTTTTTGAAAAAGCTATCAATGGCTCCACGTTT 



FIGURE 22 

>retrotransposon_6 1438bp Tcal-like LTR: 91-479 

GTGTAGATGCAATAGGTGTATGAAATGTATCTAGATTATATCATGAAGCCCTTGCCAATAAAATCTAGC 
CAAAAATTTGT 

GTACTGCAATTGTTCGCTATAGAGAGATATCCTAGCCGGAATGCACGACAATCCTGAGACGGAAGTCGA 
TCGTCGATGCC 



CATGGTGCGTGGTGAAAAATTNTCTTAGAAAATTTGTTCTTTCCTTCAACTGCTTTTAAGAGAAGGGAG 
GTTCAAGTGGT 

TTAAGTACGACGGTCACAAAGATTGCGGCTTATGAGGCCCGAACTGAGTTGAAATACAAAATCAAGATA 
TAATTATATAC 

CTTACTTGTCTATATTGTTTTATAATACATTCTTCAGATATTTAAATTTCTGTGTATCATCCTATAAAA 
CAGAGATACAT 

TCAGTACATTTAGTATACTGAGTGAACTGGTACCTGTGACATTCAAGATAACTGTTTCGCGCACGCTGG 
CAGACGAACAG 

CAATTCTGTAATTGTCGTAGAGTAGCAACAAATCTTCCCGATGATTGGTACTTGTGTTAGTCTACACGA 
CATGTGTTTTG 

GTACACTTGAACTGTATGTCCAAGAATGGAAACATATGCGGGAAGGACGCGAAAGATGAGTTTGGTATA 
GAAGGGATAAG 

AACTGTAAAATATATTATGTAGTTATAfATTTTAATTATGGGAAATTGAGTGTTTATTCTGTTCAACAA 
GTTTCAACCGT 

AGAGATTACATTTAAAGTCTGTGGTCGAAATCCACAAGATACAGCAAATTCATGAATTCACCTATTTAA 
ATCAAGTTTAC 

CAAGCACCATTGCCTAGAACTTGCCATATCATCAATTAAGTCAGACATTACTAATTTGAGCAAAGCTTT 
TAGCTTAATGG 

GCCAACTAATTTAAGTCGAATTGGTAATGCAATCTGTTCTTCATTTGAGTCGCTTGCTACGGCTCCATG 
ACACATCCATT 

TGATTGTTTTAATTCGAGCAATTATCCACCATAACTCTCAGTAATATCATTAACAGTTTTACGCTTAAT 
AAGCATAGAAA 

GTTGTATGAAGTTGTCTCCTAGGTATGCTAGAGAGATTTGTATATACGACCAGTAAAGAGTGTGATGAG 
GTGTTTACTGT 

AGGGTAAATTGCAATTGACTTGAGTTGATAGCGGTTATTACAAAAGTATAGATTCAACAAATTAAGACA 
AGTACCAAACG 

ATAGGCCGAATGTGACTTATACCGTTGAAGTTCAAGCGTTTTTAACAAATAGAAATGTGAGATTAATGA 
GTTCGACAAAT 

GTTTTACTAGATACTATTAATTTCGATGTACTATATAAGTTTAACCAGCTATAACCGGCAGAGCAGACT 
TCCTGAAACTC 

AAATTGGTTGTGTTTGGACTTGAGTTACACCACAAAGTTTGACAATCGTGAGGACATAGCAACCTATCA 
AGCCACTCA 



FIGURE 23 

>retrotransposon__7 1304bp Tcal-like LTR: 749-1133 

TGAAGATCTGGCTTTGGCCAAAGTATCAGCTGCATTAGATACTGTCATTGGCATTGGCTTGAACCCACT 
GGCTGTGGATG 

TAACTGTGGAGCCAAAAGCTCGTAAAGCTTTGGCGTTCATGGAGAAAAATCTTTTAACAGACATTGTAT 
AAACGTTGAAG 

AT T AAAGAAAAAAAAAACAGAAAGATTACGAATAAT T T GT T T T TAATT GG TGGGTATGAGGTGT TGCGC 
AGTCGACTCAA 

CAATTCTCTTTTGGTGCACAAAGTTGGTTTTATGGTCAACAATTACGGAGTACTGTCTGTAGTGATGTT 
GAATCTAAGAC 

GGAAATGCCTCCTTTACATTTGTTTCTATTCTCTTAAAATACATATTCAATTGTGTGTTTTAATTGAAA 
ATTTGTTCATC 

TTCATCTGATGATTGTGTAATCTTTGCGGGGGGGGGGCGTGTCATGAACCAATCTCTTTGAGTCATAGG 
ACGAGTCATCC 

TATTGTGACTCATGGCTCATCTTACTCTCTTACTAATCTCTTACTTCATCTGTTTACTATAAATATGTC 
TACTACTCCTC 

TATTTTATTACCTCGTTTACTATTTTTATTCAATATATGATCTTATCTTTAAATTTCTTTTGACAAATA 
CAATCAACTTA 

CAAAACAAAAGAAAAAAGACTAATAAAATAGAATTAATGAAAAAAAAAAAAGACTAATAAAAGAAAAAG 
AAAGAAGACTA 

ACAAAAGAAAAAACAAACCGGAGAACCCTTCGCTGTAGAGGAATTTCCTAGCCGGATTGCACGACAATC 
CTGAGACGGAA 

TTCGATCGTTGATGACCGTGGTGCGAGGTGAAAAGTTTTCGTAGAAATTTTGTTCTCTCTTTCAAACTG 
CTTTTAAGAAA 

ATGAGGTTCAAGTGGTTTAAGTACGACGGTCACAAAGATTGCGACTTATGAGGACCGAACTAAGTTGAA 
ATACAAAATCA 

AGATATAATTATATACCTTACTTGTCTATATTGTTTTATAATACATTCTTCAGATATTTAAATTCCTGT 
GTATCATCCTA 

TAAAACAGACATACATTCAGTACATTTAATATACTGAGTGAGCTTGTATCTGTGACATTCAAGATATGT 
TTCGCGCACGC 




TGACAGACAAACATTTGGTTGTAAAAAAAAAAATATTGAAGAACCTCATCACCAAGATGTTTGAAAAAA 
AAAAAAATCAA 

ATACTTAATCGCAAGCTTTTCAATTTATTGATTGTTTGAATTAATTGAATATAAACAAAAAAAAAAAGA 
ATTCAAATTCA 

TTTGACATGTCAGTGGAAGTTAGA 



FIGURE 24 

>retrotransposon_8 3604bp POL protein: 591-3575 

AGCCCCAAAATGGTTTTCCTAGNGGAGGATGGAATGGATGGGACCACCCACCAATTTGGTTCCCGGAAT 
TTGGTTTAAAA 

AAAAGTTTACGGGGATGATTTATTTCCAAACCCAGATGTTTCCTGCTGCTGAAAGAATTGGAAAAGCTC 
TTTTCAGTNAC 

AATCTAACTGAGAGAACTTGAAAGGGATCAGCATTTTTGTTATGTCAACATTTAATGACCAATGACCAC 
CAGCACGATGA 

TATTATTCTTAAATTTCTCGTTAGCGGTGTCTCACCATGGTACTTACATCTGCAAATTTACATGCTGTC 
ATATAAACTTG 

GATTCTCAAATTTGTTTTTAGAGATTTATGCTCAACATTATGAATTGTATAAAGCAGATCCCATTTACA 
AATTGCCAGAT 

AGTATGACATTGTTGAATGAAATAAGATCAAATAGAGATTATCCTAAAGTGGTAAATGCTGCAAAAAAT 
ACAGTACAAGT 

CAATAATGTTTCATCCAAGAACAATAAAAAGAAGGATGAATGACAACAATTAGCCAATAAAATTGAGGA 
AGTAGGACGTT 

ATAGCGAAATAAACGCAACATCTACATATCATGAAATTGGCGATACCAACAAAAACCAAAGGACAATTA 
ATATTGAATTT 

GAAAAATCATACAAAATTAAGTGAACAAAAGAAGAAAACAAACCTATTGGTATATGATCTGGGAGCCAC 
AGTATCCGTGG 

TGAATGATAAGACTTTACTTAACGACATTAAAGAATCAAATATCGAAATTGCAACTGCTGAAGGGGAGA 
CAT C T AC GGC T 

TATGCTTTAGGTACTCTAACCATATCTGTGAATGGATTGAATGCGAAATTAGATGGTGTTCTATACTTG 
CCATCTATTCA 

ATTAAACTTAATATCTATAAAACAATTTGAAGATTTATGCTACGCAATTTTGATTTCCGAAAATTTAAT 
GTTTCTAGTTC 

ACAGTGACCACGAACCTACGGTCATTGCGAAATATTCACCTAAAGATGACTTATACTCAGGCCCAAGAT 
CGGGAAACTTT 

CTTAAGAAGAATCATAATGAACAAAACCAAATTTTGCTTGACACTGCTAAAAAACTATTAGGATCAGAG 
AACATATTTCT 

GGAGAAATCACTGAAAAATCCAATGATTGATCAAGGAAAATTAGATCCGTTGAAAATGAACAATAAAGT 
AGAAAGAGTTA 

ACTATGTCAGCATACACAACATCAAACAAGAAGTGGCAGACAAATATATGATAAAAGATCTTTACTACT 
AT CAT TT ATT A 

ATTAATCACCTTTCACATGAAAAACTACAATTATTAGTAAAAAGGGGAGTGATTAAACCAGTCAAATCT 
ACTTCGGCTGA 

GTCGGCCATTTTAAATTGTCAGATATGTGTTGCAGCCCATGCAAAATTAGCTAGCCATAATCACACTCA 
ACAACGGGAAT 

TGGAGCGACCATTACAACGCCTCCATTTGGATACCGCCGGACCATTTACCTCAAATAAAACTAAGAGCT 
ATCTTACAACC 

GTGATTGATCAATTtTCCAGATATACTGAAGTTATTGTATCTGACACCAAAGCAGTCAAACAAAGCATA 
TTGCATAGACT \ 

TAGGGTCTGGAACAATAGATTTCAGTTTAAGATCGCGGAGATAAGATATGATAATGCATTGGAGTATCC 
ATCGGCTGAGG 

AGTTAGAGGAGTTAGGAATTTATAAACACCTTCTCCCAAACTACTCTCCTATGCTTAACGGTACAGCTG 
AAGCAACCAAC 

CGCCCCATTGTCCAAGGTATTTATAAGGTAGTGTTAAATTTTAGTTGTCAAGTATTAATACTTTTCCCA 
TTTATAGTGGA 

GTATGCGGTTCATATCCGGAATCATACACCTATAAAAGAATTTGATGGTGCTACTCCTTATGAACGTTA 
CTATGGTTTAT 

CTAAATACGTCATACCATTTTTTCAGTTTGGAACCGACGTTTTGATAAAATGTGCTAGTGTACAAGAAG 
CTATTTCATTA 

AAACTACCATCTTCAAGAGATAAAGCTTTTCCTACAGTGATGTTTGGTGCTTTTCTCGGTTACGGCTCA 
GATTCCTTTAC 

CTTCAGAGTTTTAGTTTCCACGAAAGGATATCCAGTTATTACAACATCAAACATCCGTCCAATAGCGAC 
GATGCAAGTAC 

TCAATGACTATTTGGCATACATATCGGAGAATAGCTCAATAAGCTATGACGATACATTCTTATCACCTT 



TGAATCACCCA 

ATGATTCGCACAAACCAACATGATAGACGTGGAGACAATATAAATGTCGAATATGA?^CCGTCCAAAT 
GTACCATTTGA 

ATATCATGCTGAACCTCCTCGTACAAATTCATCGACGGGAATTATCGATCGACCAGATATTAGACCTAG 
AGCTGATCCCA 

CCTGGCAACGTATGCCTGATGCCAACATACATCAGGAAACAACAACTGTACAGACTCCTGATCATGGGG 
AGTTAGATACC 

ATGATCAACAACGAACACCAACTACCACGATCTGGGGAGGGTAATTACCCCGGGCAACAGGTGCGCACC 
GATATTATTGG 

GCAATTTCGAGATCGCGGGCCTACCACTCTAAACACTCCGATCGATCTAGGTGTACCCGATGAAACAGA 
CGATATTAGTA 

TGACATCAGAGAATCCAATTGATTCCCCAAATTCCGAGATGATCATATCCCCATCTTTACCCACAAATG 
AATTGGAACAT 

CAAATCGATATCAGTTCAGGGGAGATGTCGTTATTGCAAACGAATATGGAAGCAGATAACGAATTGAAA 
ACAAATGAAAT 

GGTATTATACAAATCAAAAAATGATGGTATTATCATTCAACAACAACAATTCACTGAAAATTTGTCAGA 
TGAAAATGAAG 

AAGATTCATCAACAGATGAGGAAACATTGGAAGACAAA?\AACAACAGCGATTGGAATATAATATTTCAC 
CAAACGATGAG 

TGGATAAATAATGACGTTCAGAACGAAGATGACACACAAGTGCCACATGTTAAGGAACCAATCAATTAT 
GAAACTCAAAG 

TAGAAATGGAACAAACATGCCACGAATTGAAATGGGCATAATAGAAAACTTAAGTGATGATGGAAAGAA 
TACACCACGTG 

AATTACGTATGGTCACCTACGATAATAATAAAAAAATTCAAAAGTACCAAAACAGTAATATCGAGATCC 
TGGAACCCAGA 

AACGAAAATAAAAACCACACATTCATTGAAAGCAACTTAGAATTACTTGACAATCAAGAAATGTTTCAA 
GAAGATCCTCA 

AGTTGAAGATATTCGATTGACAACTCCAAAAAAGGACAAATCGTTATCACCTGATTTCAATCAAACCCA 
TAATGAAATAC 

AACTATTCATGGCAGATATCAATGAAGATATGCTAGAAGAATATGATGAAAATATAAATATGAATGAAG 
TGTTAGCTGAC 

TCCACGGAGACGTTGGACAAAGAATTAGATTTAGATGAAGAAAGTGGAAGGATCGAATATATTGCTGAT 
AGAGTTAGAAA 

NAAGACAGAGGTACTGATGGTGCGCCACACGGGGAATTNTTTACAGAAAAATGGATAAAGATTTTTGGG 

TCCATTAAAAA 

GGCC 
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>retrotransposon_8 POL protein 995aa 

MKIJ^IPTKTKGQLILNLKNHTKLSEQKKKTNLLVYDSGATVSVVNDKTLLNDIKESNIEIATAEGETST 
A 

YALGTLTISVNGLNAKLDGVLYLPSIQLNLISIKQFEDLCYAILISENLMFLVHSDHEPTVIAKYSPKD 
D 

LYSGPRSGNFLKKNHNEQNQILLDTAKKLLGSENIFSEKSSKNPMIDQGKLDPLKMNNKVERVNYVSIH 
N 

IKQEVADKYMIKDLYYYHLLINHLSHEKLQLLVKRGVIKPVKSTSAESAILNCQICVAAHAKLASHNHT 
Q 

QRELERPLQRLHLDTAGPFTSNKTKSYLTTVIDQFSRYTEVIVSDTKAVKQSILHRLRVWNNRFQFKIA 
E 

IRYDNALEYPSAEELEELGIYKHLLPNYSPMLNGTAEATNRPIVQGIYKWLNFSCQVLILFPFIVEYA 
V 

HIRNHTPIKEFDGATPYERYYGLSKYVIPFFQFGTDVLIKCASVQEAISLKLPSSRDKAFPTVMFGAFL 
G 

YGSDSFTFRVLVSTKGYPVITTSNIRPIATMQVLNDYLAYISENSSISYDDTFLSPLNHPMIRTNQHDR 
R 

GDNINVEYENRPNVPFEYHAEPPRTNSSTGIIDRPDIRPRADPTWQRMPDANIHQETTTVQTPDHGELD 
T 

MINNEHQLPRSGEGNYPGQQVRTDIIGQFRDRGPTTLNTPIDLGVPDETDDISMTSENPIDSPNSEMII 
S 

PSLPTNELEHQIDISSGEMSLLQTNMEADNELKTNEMVLYKSKNDGIIIQQQQFTENLSDENEEDSSTD 
E 

ETLEDKKQQRLEYNISPNDEWINNDVQNEDDTQVPHVKEPINYETQSRNGTNMPRIEMGIIENLSDDGK 
N 




TPRELRMVTYDNNKKIQKYQNSNIEISEPRNENKNHTFIESNLELLDNQEMFQEDPQVEDIRLTTPKKD 
K 

SLSPDFNQTHNEIQLFMADINEDMLEEYDENINMNEVLADSTETLDKELDLDEESGRIEYIADRVRXKT 
E 

VSMVRHTGNXLQKNG 
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>retrotransposon_9 1249bp Tca2-like LTR: 541-820 

TCTCTATGTAGGCTGACAGGTGAAAATTATGAATTAATTGCATTGGCCAATGACAAATGAATAGACAAA 
ACAGCAAATAA 

GGTTGCAAAAGTAGCCCAAACAAACTAGATTTCGGTTACGAATTTTCCATCTTTCAAAACAATGAATTT 
GTTTAGAGCTC 

TGTGCCATTTATTGCAACTAAAATGAATATGCAATTAAACAATCAGAGATGTATTGGATTATCCCCGTG 
GTATACTTTTG 

AGTTCACCATTTGTTTTTTTTTTGGGGTTAAATTAGTGCTCCTACTAAAAATCGCATTTATCTTACACT 
CACCATTTTGA 

TAAGTTATCTCTGGTCAATCGCAAATACTATGCTTCTAATTAAGAGTTCTATGTAAATCCCATTTAATT 
TTGATCAATCT 

ATTGGTTTGAAGTAAGAGTTGATTTTCTGTAAAGATTTATTTGGCCAGTGTAGTTCGGTGTCAAAAATA 
TATTATGATGT 

ACACTAAAAAACACTAAATTTCAAGTCAATGGGGAACACAAAACTGAATTAATTACTATATGTTGGTTT 
GTGCACTATTT 

TGTGTCAGAAACTGATCAATGAAAATGATGGTTATTATGAGAATGGAAAATTTTTCCATCACACATCAG 
GTGATGACAGA 

ACTAAACTATATTGTGTAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATCAACGAGATAGA 
AGAGAGGAGTT 

TCAATATATATCTTGTGAATAATAACTTCGTTCTAATTCACTATACACAACTAGACGTGTACACGCTCA 
ATCTCAGGTAA 

AGAAAGTTTATATTCCATCACTATATAACAACAATCAGGCTTTGCAAAAAAACATTTAAAACTAATACT 
GGTAATATGGA 

AATATAACGCCTCGTAGTTCTACGCACGTGGCATCCTTTATCTATTTATTCAATTTACCCCTAATTTAT 
GAATTAGCTTA 

ATAAGAGCAGTCAAATTAACACGGCTCAATTAATAGTACTTAATAATATGAAGCCGATCAATTAACCGA 
TCCTTTGAATA 

ATTTGAAAATAAAATAAAGTAATATAAATAGGTATGCATTTTCCCTACATTTATTTCCTCTTTCTATTT 
TAATTTGTTTC 

CTAAACAGCAACAACAACAATTGAAATTCAAAAATGGTTTCTGTTTCTAAATTATTGAACAATGGATTG 
TTATTAGCTGG 

TCAAAGTGTCTTCCAAGATGTTGCTACTCCACAGCAAGCTTCTGTGCAA 
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>retrotransposon_10 5611bp Tca2-like LTR: 1136-1414 

TCTCTATGTAGGCTGACAGGTGAAAATTATGAATTAATTGCATTGGCCAATGACAAATGAATAGACAAA 
ACAGCAAATAA 

GGTTGCAAAAGTAGCCCAAACAAACTAGATTTCGGTTACGAATTTTCCATCTTTCAAAACAATGAATTT 
GTTTAGAGCTC 

TGTGCCATTTATTGCAACTAAAATGAATATGCAATTAAACAATCAGAGATGTATTGGATTATCCCCGTG 
GTATACTTTTG 

AGTTCACCATTTGTTTTTTTTTTGGGGTTAAATTAGTGCTCCTACTAAAAATCGCATTTATCTTACACT 
CACCATTTTGA 

TAAGTTATCTCTGGTCAATCGCAAATACTATGCTTCTAATTAAGAGTTCTATGTAAATCCCATTTAATT 
TTGATCAATCT 

ATTGGTTTGAAGTAAGAGTTGATTTTCTGTAAAGATTTATTTGGCCAGTGTAGTTCGGTGTCAAAAATA 
TATTATGATGT 

ACACTAAAAAACACTAAATTTCAAGTCAATGGGGAACACAAAACTGAATTAATTACTATATGTTGGTTT 
GTGCACTATTT 

TGTGTCAGAAACTGATCAATGAAAATGATGGTTATTATGAGAATGGAAAATTTTTCCATCACACATCAG 
GTGATGACAGA 

ACTAAACTATATTGTGTAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATCAACGAGATAGA 
AGAGAGGAGTT 



2. 



TCAATATATATCTTGTGAATAATAACTTCGTTCTAATTCACTATACACAACTAGACGTGTACACGCTCA 
ATCXCAGGXAA 

AGAAAGTTTATATTCCATCACTATATAACAACAATCAGGCTTTGCAAAAAAACATTTAAAACTAATACT 
GG T AAT AT GG A 

AATATAACGCCTCGTAGTTCTACGCACGTGGCATCCTTTATCTATTTATTCAATTTACCCCTAATTTAT 
GAATTAGCTTA 

TCCTTTGAATA^^^'^'^^^^^ 
ATTTGAAMTAAAATAAAGTAAM^ 

TTATTAGCTGG^^^^^^'^^ 

TCAAAGTGTCTTCCAAGATGTTGCTACTCCACAGCAAGCTTCTGTGCAACAATATAACATCGTCAATTC 
TCTTGGCGGTA 

GTGCCCCTTATATTCAAAGAAACGGATATGGGATTTCTACTGATATCCCTGCTGGTTGTGAAATTGCTC 
AAATTCAATTG 

TATTCAAGACATGGTGAAAGATACCCAAGTAAAAGTAATGGTAAAAGTTtAGAAGCAATTTATGCTAAA 
T T T G A^VAiAC T A. 

CAAAGGTACTTTTAAAGGTGATTTGGCTTTCTTAAATGATTATACTTATTTTGTTACTGATAAAAACAA 
TTACGAAAAGG 

AAACTAGCCCAAAAAATTCTGAAGGAACCTATGCCGGTACAACCAATGCCTTGCGTCACGGTGCTGCGT 
TTAGAGCCAAA 

TATGGATCCTTATACAAGGAAAATTCAACATTACCAGTTTTCTCTTCCAATTCAGGTAGATGTTACCAA 
ACTTCAAGATA 

TTTTGCTAGAGGATTTTTAGGTGATGACTTTAAAGAAGGTAAAACTGTCAAGTTTAACATCATTTCTGA 
AGATGCTGATG 

TTGGTGCCAATAGTTTGACTCCAAGAAGTGCATGTTCCAAGAACAAAGAACGGAGCAGTAGTACTGCCA 
AAAAATATAAC 

ACAACATATTTAAATGCTATTGCTGAAAGATTAGTTAAACCAAACCCAGGTTTGAATTTGACTACAAGT 
GATGTCAACAA 

TTTATTCAGTTGGTGTGCTTATGAAATCAACGTCAGAGGAAGTTCACCATTCTGTGATTTATTCACCAA 
TGAAGAATTCA 

TTAAGAACTCTTATGGTAATGATCTTTCCAAATATTATTCTAATGGTGCTGGTAATAATTACACCAGAA 
TCATTGGTTCA 

GTGATTTTGAATTCATCCTTGGAACTTTTAAAAGACACCGAGAACTCTAATCAAGTATGGTTATCATTT 
GCTCATGATAC 

TGATTTAGAAATTTTCCATTCTGCTTTAGGATTATTGGAACCAGCTGAAGATTTACCAACATCTTACAT 
CCCATTCCCTA 

ACCCATACGTCCATTCTTCTATTGTTCCACAAGGTGCCAGAATATACACAGAAAAACTTCAATGTGGAA 
ACGATGCTTAT 

GTTAGATACATTATCAACGATGCTGTCGTGCCAATTCCAAAATGTGCTACTGGTCCAGGGTTCTCTTGT 
AAACTTGATGA 

TTTTGAAAATTTCGTTAAAGAAAGAATTGGAGATGTTGACTTTATTAAACAATGTGGTGTCAATAGTAC 
CTACCCATCTG 

AGCTTACTTTCTACTGGGATTATAAAAATGTCACTTACAATGCTCCTTTAGAATTGTAAGACATCATTA 
GATCAATTTAG 

ATATCCAAACATTTATTCGTTATTCTCTTCGTATATTATTTATATTCTTCCTTTTCTTGAAAAAAAAAA 
TAG AC AAT T T A 

TTTAGACTTTATAACTTTTACTTCGTGTTGCAACAAATTGAGCATTTTACACGAAACTTTAAATAATTG 
AATCCTTCGAA \ 

AACCAAAGTTTTATTGGTCGACGGGTTGGTTAACATGGAATATATCACTTTCTAATAACTATGTCACAC 
C A^^C.AA^VT J\T C 

AATATGAGTGTTTCAGACAAATACCCAGAACTTGTTAGACAATTTTTCCTTCTTGATGAAGTGAAGGAA 
ATTTTGCCGAA 

CTATCCAAAATACAAAATTTTACTGCAAACTCCTGAAGTCGATCGTGAATACTACAAAAACATCACCAG 
TCCTGAATTCA 

TTAGACAATGGCAGCCAGAAGTCCTCAATCACTACCGAAATAACTGGACCGAAGTCACTCCTCTTTGTG 
CTATTGTACAT 

GATAGAACCATTGATGCCGGTTTGAGAATCCAAAAGTTTTTCCATCCATCCATCTTACCGAATGAACTT 
CATGGCGATGT 

TTGGATACTGGTAAAAGAGAACAAAGAAGAACTCGATGCCTTTATAGAAAATGTGCAATGTCTTCAAAA 
TTATGTTAGAG 

ATAGCTCCAACAGTAAATACACTTATTATCGTTGTGAGTATTGCAAAAAGAATAAAGGTGTTAAAAGTA 
AAAAAACTGAT 

TGCAAGCATAAAATTGCAGTACATGCTCTTGAAGGTGGAAAATACAAAATAGTCTGGCACTTTCAGCAT 
AACCATGCTTT 



CGATCCAAGAAGGATTACAAAGGCAACCAGAAACTGGTTGATGGACTTAGCTTCAACAAATATACCAAG 
GGCAAGTTCTG 

ACAGCAGGAGATCAGTGACTAAATTCAAACTGAGTTCATTTTTACTTTCTGACAAATTTAAAATTTCCA 
ACAAGGTATTT 

AATTATTATAAAAACAAAAATAAAGAGAGCCAGGCACATCTTGACAAAAATGTTATCAAAAGTTTAAAA 
ATATGGGTTTC 

ATATATAAATACCCTTAATGAATTTGCCGTGTTTAAAAAGAGATCAACAAATACTGAAAATGNTGAATT 
CTGTGACGTGG 

AAGGCGATGCTCTGAATCCTGAGTCTACGTGGTATTTTGGAATTATTCTTTTGAGCAATCTCCAATATA 
TGCTGAGCCCA 

CAAACTGTTTTCCTTGATAGTACACATAAATTAGGCCACGGCCCTCACAACGAGGACATAATAACATAT 
ATCTTTATCAC 

AAAAAGCTCTTTATCTGGAGGAGGGATACCAATAGGTTACTTAATAACAAATAGAGAGTCTCATGAGCC 
GTTAGCATCAT 

TTTTGAGATTTTTTGTTGAAAAGAAAATACAAATCAAAAGATTCGTGATAGATTGTTCAGCTACTGAAA 
TAAAAGCTATT 

GAAGAAGGATATAATGTTGGTATCATTGAACCCACAGATGGATCATCAAGTGCTGGTGATAAATTTGAA 
GCTATCATAAC 

GTTTTGCACTTGGCATTGTTTGAGAGCTTTTAATAAGACCATTAACAAACTTATTACAATACAAAATAG 
AACAAATAATG 

AGCAAATATCCCCAAATGAAATTATCACAGAAGTTGACGGAGAAATGACAGATGAAGAATTCATAAATC 
AGATAGCCACT 

CAAGGGGTTGTTGCACAATCAAACTTAACTGCAGGTAGGAATAAGGAAGAGATAATTGCAAATCAAAGA 
ATTGCTCTTTC 

ATATATGGTAGAATTAAAACGGAAAAAAGCCATTGAAGAAGCTAATGATTTTTTGCATGTAATCGAAGC 
CACGTTTCGGG 

AATACCCGGACTTTGTTGCATACGCCCAGAAAACATTCAAAACCACAGGGAAATACTGGTTAAACTGCC 
ATTTTGGTAAT 

TACAGAGAACTTACAAATAATTGTGTGAAAAGTTATCACCAAGTTTTAAAAACCAAATATTTCGAAAGA 
CGCAGAAAATA 

CCGAGTTGACCGAGTAATTTGGATGTTTATTGAACCCATTGCTAAGTACTATGAGTATTACCATTCAGC 
TGTTATTGTTA 

CATCCCTGTTAAGGTACATTGATAAAGCTGAAGAAGCTTCCAAACTCAAAGCAGAAGCAGTTTCAGATG 
AGGACATGAGG 

CAAATGATTGTTGACCTTCCAGGTTATATTGCAGTTAAATCGTTCAATGGATCAAATTATTACAAGATT 
AGTTTTGGTGA 

ACGTGGAATCTTTTCCTGCGAATGTCCGTACAACGAGTATTCAATTGATTGGTGCAAACACATTTTCTT 
ATATAAGCGTT 

ATAAGGTGGCTAAAGGATTGGACATACCTATTGTCGAGCTTGAAAGAAACCCTTTGGCTGACTTAAGTG 
GTTTAAACGGT 

ACTAATGAGATAGTTGAACGAGAAACAGATACTATTGGAAATGAATCAGAAGACGAAGAATTAGTTGAT 
AGTGAGTCAGG 

ATTTAAGAATGCCACCTATAATGAGAGTGATTTTGGTGACGATAATTTTGATTCTATGGAAAATGATCC 
AGATGGTGACG 

AACCAGATTTTAGTATTGAAAACACAGAACCAACTGAAGTATCCCAAGAAGAGACCGAAGAAGAAATTG 
GTGCCAGGCTT 

GCACGCGACAGAGTTGATCCTGGGTTCTCCATAGATGACGACAATATTGGAAACGACTTCGAACTCGCT 
GACTCTTCTCA 

AGTTTTTACAGACGGTGGAACAGCTTATTACACACAAAACACAGAATCAGACCCATTTATTGAATGGCC 
TATAAGTGAAA 

CAATTGATCTGCAAGAAAGTGCTGATGTTATTTTAGAAATCGAAAGCATAGAAGGGGTTTATGCTAAGA 
AAGCTGCTAGA 

AATATTAAGCAACGGGAAGAGAATTATAGTAGTTTAGATACAGAGGTTAAAAGAATTCAAGATGAGGAG 
AAATCTCAAAG 

GGAGAAGGTTAAAAAGCTAAGGGCATTAATTAAAAAAGAAGAGATGGAACATAAAAAGAAAATGGCGGC 

AGTGAATAGGA 

TTCAAAAGAAA 



FIGURE 28 

>retrotransposon_ll 1308bp Tca2-like LTR: 136-416 

TGGTGCCATTTTTAGAATTGATGTCTGAAATAGAATATGAGGTCCAGAGAAGTTTTATTTTTGTTATAC 
ATCATTTTTTT 

TTTTTGCTTTGTCTCACCGAATATTATTTGATTCCTAAAAAATTGTAATACCCTGTGTTGGTTTGTGCA 



2; 



CTATTTTGTGT 

^J^^J^'^^'^'^^'^^^TATAATAAAGGGTATGAAATACCAACATCCCAGGATATCAATTATATAGAAGGGA 

AGGAGTTTCAA 

TATATATCTTGTGAATAATAACTTCGTTCTAATTCACTATTCACAACTAGGCGTGTACACGCTGAATCT 
CAG G T AAAG AA 

AGTTTATATTCCATCACTCTGAAGTCATACATTAATATTAAATAAACAATCTAACACTAGCATGCATTC 
A T AAC C T AT AG 

ATCATTCTAAACAAGCTGTTAACACAAATCCAATCAATTGAATTTATCATATAATGAAGTAACTTTTTT 
CAAGGCAACAT 

tattttctgca'^'^^'^^'^^*^^^^ 

^TATCAAACACCGATTGCTTTTTGTCTGAAGTTGCTGGT^^ 

tgttactgacagattggcactgacattacctgaattgttcatgtttgctgttgaaagagcaggaactgt 

ACTTGGATAAG ^^^^ 

cagccgattcaaaagaagatgtggacatgagtgtcaagaaaatgtgtagaatcagtacaagactggaaa 

AC AiG A^^G G A.AC 

aaagtgaactggatattgtagttttgttgatagtactcgcgagctttaatttttttttgtaactggcgg 

CAG AT C T T 
AGMTCATGTT^^*^^^^^^^^^^^ 

ACTAGTCATATTTTCTATAAAAATTCAATACTTCATTCTTTTTGTTCAATACTAACTATAAATGCTTAC 
AAATAGATTCA 

^^TCAACCAGATCCACCACTTCATTAGGCTCAACCAATTCTTCATAAATAGAAACGTCTT 

GATGGGAAACCCTAGCTTGCATTGAAGGAAAAATACATAATCCAAATAACAAACTGTCTTTCCNAATAT 
TCTCAAAATTC 

GACTTCACCGTCTTCCAACCAAGCAGGT 



FIGURE 29 

>retrotransposon_12 1672bp Tca2-like LTR: 1346-1533 

CCTATCAGGTACTTCCCCACTTGGATTGGCTTCTGCCTCTCTTCTTCTCCCAACCATCATCCCAATATC 
ATTCCACCCAT 

CGTCTTCATCGTTGTCGTCTTTTGTTGGTNTCTCTTCTTGTTTTTCTAGTTTACCACTATAAAAATCAA 
^^^^^^^GGCATCAGATTTATAAATTTTTTTAATTTTATCAACATAATTATCAACAATCCAATCAAGA 

ACTTTCATGAC^^^'^*^^'^^*^'^^^^^'^'^^^'^'^'^^'^^'^^^^ 

^^TTTCGTTAATTCATCTAAATCATTCAATTGTTGTTTATCATTAATAATTTGATTTATATTGATGG 

ATTAAATTTTTAGAAATTTTAGAATTTAAATAATTTTTGATTATAGGATATTGTAATTCATTTATAAAT 

AGTAATTGATTTAATAAAATTGTTGTCCTCGTTGTCTGATACAATTTCTAATTTAATAGTATCTTCCAA 
T T CAT C AACAA ^ 

ttttcttmat'^*^'^'^'^'^^^^^^^'^^ 

TTATCGTATGCATTCATATTATTATGTCCATTTTTCAATAAAAACCGATTGAAATCTTGTAAAATTGCT 
A PAT PAGT AAT 

AGTCAATGGATCAGGAATTAAAAGAATAGTTAAATATTCATTCAATTGATTAACAAAATTTTCATAAAG 
TGAATCGACTC 

GTTTCTTGATTTGTTTATATATAATATATTGAGAATTTGTATCAATGATGATTTGTTTAAATAAATTAT 
TTAAATATTGT 

^TCTAATMACTTTGTAATGTTTTCGGTTTCCCCAAATACGTTTCAATTTCTTTTAATT 

^^^^^^^^GTTGTAAATTGTCAGTAACGATTTCAAATTTATTATTCAATTCAGTAATTGTTA^ 

TACTTTCAGTGGTATTTGAATCTTGAGGAATTTCTTCAAATTGTTTTCGGAAATCATTATCATTTTCAA 
GGGTTGTTTTG 

TTTATTTTGGATAATGTTTTATTTATGTTCTGTTCAATATCTTTTAAATATAATTCTTGATCTTCTAAT 



TGTTGTTCAAT 

CGATGGCATTATTGGTGTTGTATAAAAATGGAATTTTGTAAAGTTGAATGTGTTGGCAACACTTGTGTT 
TGTATGGGCGT 

ATATTTTTTGAGGAGATCAAAGCAAAAAATATTTTGAGACTTATACACGCAACATACAGAACAGTTGTT 
GGTTTGTGCAC 

TATTTTGTGTCAGAAACTGATCAATGAAAATGATGGTTATTATGAGAATGGAAAATTTTTCCATCACAC 
ATCAGGTGATG 

ACAGAACTAAACTATATTGTGTAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATCAACGAG 
GATAGAANGGG 

ANGGAGTTTCAATTANAATAATCCTGTNGAATAAATAAACTTCCGGNTCCTAAATTCNNCTAATACCNA 
CCAAACCTTAG 

NACCGTNGTAACANCGCCTCCAATCCTCCANGGGAAAAAGAAAANGTTTTAATAATTTCCCNATCCCGG 
ATT 



FIGURE 30 

>retrotransposon_13 690bp Tca2-like LTR: 464-690 

TGATACGATTGAATGGTGGAGACAAAATATCCGATGTGTTGAAAGATAAAATTGTACTCGAATATCCCA 
CAATATATGTT 

GCTGCAAATGACGAGTGTTTACAAGATAGAATTATAGATAGCCTTCAATTGGCCGAGGAGGAAGAAGAT 
GACACCACTGA 

CTCAAGTGAGGATGATTCTAGTGACTCAGAGAGTGATGATGATGATAGTGATAGTGGTAGTGAAACCAG 
TAGTATTGGAG 

ACGGTTCAGGTGAAGATAACGATTCTGATTCGGCACCGGAAGAGACATCTCTGAAACTACCACCTTTTT 
CACAGAAATTC 

TTTGAAGCGTCAGCTGAGCCAAAACCAATAATAGAAGAGATAGGATCTAACAAGACTGTAGAAGAACCA 
TAACGAATGAA 

TATAAAATACTTGTATTATGTAGTGCCAATAAAAGTTGAAACGGTCGCACTACTTTTTAGTCCTGTTGG 
TTTGTGCACTA 

TTTTGTGTCAGAAACTGATCTATGAAAATGATGGTTATTATGAGAATGGAAAACTTTTCCATCACACAT 
CAGGTGATGAC 

AGAACTAAACTATATTGTATAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATTAATTATAT 
AGAANGGAAGG 

AGTTTAATATATATCCTGTGGAATAACAACTTCGGTCTAATTCACTATAC 



FIGURE 31 

>retrotransposon_14 1912bp POL protein: 1169-1839 

CTAGGTTTTAATTCACTATCATAAAGATCAATGGTTAGCCCAAAATTAAAATATGGAAGCCAAAACTTC 
CGTGGTCAAAA 

AATGAACTAAGAAGCTAAAGTCTTTTTGAAACAGTATGCCATTATGTTTTTCAGATGTTTTTACTTGGT 
TGTTATATTAA 

AATCCAAAGCTCTGGCTCTTATCAAGAATTTGTCAGTCAACTCATCATCAAATGAGTGGATATATTACT 
TTCAAGAATCA 

TCATTACCAAGTTGTCAAACGATTGCTAAGCAAATGTTGAAGAATACTGATTATTTCAGTTTTGAGAAA 
CCTAACCCCAA 

AGATAATTTAAGGAGAATCAAAATTTGAAAGAAAAGGATGAAAAGTTGGAGAAAGAAACCCTATTGAAA 
ATTTAAGTACT 

GATTGTTTCAGAAAATCATTGAATATGAAACAACAGAAAGGATATTTTACCAACTAATGAACATTTTCC 
TCCCTTATACA 

CCTTAAAATACATTAAATCCTTCTGGAATAGTTTTTTCTCACAAGACATTTTGGTGTATAACATTGGTA 
CTATTGTTGCT 

GTCATGACAAATAAGGAATGCTACAAAACGTCAAGGTAGAAGCTATCGATGTTTTTTCCAGCTAATGAC 
AGGACAACGTT 

AGAAACGAAGTGTGCAGACGATTTGGTTACAAAGATTGCAAGTGTATCAATTATGCTAGCATATACCTT 
ATATTTTCGTT 

GAGAGTATTTTTATCATCGTTGGTCTGCAAAACTTCAAAGAAGGGGTGCTATATGTGTTAAATGCTGAG 
AATCGAACACT 

GTATCTCATGGCGATAAAATTCAAAATATTGTCGTTAGTATGAGAAGATTTTGCTGATATTTACTTATA 
TTTCACAATGT 

TCAGTAAAGATCCTTATGACGGTGGTACAATATGGGACATGCTATCTGACACGTTGACAACCACTAAAA 
TCAGCTGTTAC 



CGATAGAGACCATACAGATTGACGCAACACATAAGTATACTCGAAAAGCTAACCCACCATATCAGGCAT 
CAAGCCAAAAA 

TCAATTTTGACTGAAAATGGACGTCATTAACTCTGAGTCGCTAAAATCAAGGTATGAAATATTTGCCAA 
.AG AiG G AA.AT C G 

ATCAGAGTCGCAATTTCTGTTCAATATTCAACCAAATACAATTTTCCAACCTATAAATCTCCACCATCT 
GTGTTATGTGC 

TGTCATTGAGTTTGCAACTGATATTTTTGCTATATCTTTACGTTGCAAAATATGCGGGGTGATGTTAAA 
CTTACCCGAAT 

TCTCCGTGTATCACATGTTATTATGCCAAATATGCATATCTAGGAAAACAGTCTCAACCATCTAACACA 
CACATTTTCTC 

ACCACTGAAGCTATGAAGATAGCCCATTCGGGAACGGTAAACGACGTAGCGGGAAAAATGTGCTTAAAA 
GAATATGGGAA 

AATAAACGGGTAGACGTCATTTCCCAGTACCATATTCTATTCAGTCGAACGTCTTCATTCTTATCAACG 
GGGGACTGGTC 

CAGAGACCTTTCTTATTTTATTGTGATTCAGTAGCGTCTACCATATACAATGATATTGTAACTTCCGAT 
C AAG T G G AAAC 

ACCGGGAGCTTCCAAAGTATGGTATCCGAATATAAAGCCACCCAAAATCCAATTCACCACGAGCTAACA 
CCTGGGGAAAA 

CGAGGTGTCTAAACCTCCTCAACTTGATTTCGAGACTTCGGTAGTAGGGAAGTTTAAAGGGCCTATTAC 
AAC C AC AAAAG 

TGGCACCACCACCCTCCATGGGAGGTCTATTAAGTACATGGAAACGCATGCTCTGGTTGATACATCACC 
TCAATCAAAAA 

AATTGGTGTTCCACATTCGAAGGAACTAAAACCGACGAGAACCTATCACACGGTGTCGACGATGATAAG 
AAA 



FIGURE 32 



>retrotransposon_15 6140bp POL protein: 1555-4302/ LTR regions: 979- 
1292, 5212-5525 

AGTAAAAAAAGAAGAAAAAAAAGCTAAAATTGGGACAATATGCTAAGTATATATAGGGGAAGACGTCGA 
ACAGCAACCAC 

GGAAAAATAATAGTGATTGTCTTTATCCGTTATTGGCTGGATGGCGACGCCACAACCTGAAATTTGGTT 
CCAACTGTTGA 

GGATGATTTATGTTTGTGATTAGAACTAAAATCATTCGAGAAAAAAGGAATAGGAGAGAACCAACTTTA 
GTCGTGTAAAA 

AGTAACATCTGCCAATTATAAACTATACGTAGTCCAAATAATTTACGGTATATTTCTGTACCCCTTCTT 
GGCAATATCAC 

AAGAATATCATAATGTTCATGAACCCTCTTTGAACACGTAGACAAGTAAACCCAATGAGGGGGCAGTGT 
TCTATTCTTGT 

AAACTGCGCACCAAAAACGGGGCTTAAAAAATAAGTTATGAAAACTATAAATAACCATGAAAATCACCC 
TACTCCCTTCC 

TCCCTTCCTTCCTTCCTTCCTTCCTTTTCTCTTTTCCTCTACCCACACTACTCACAATGTTCGGTATTT 
TTGAGGAAAAC 

TACGATTCTGTTTACAAAGGCAACCACGAAGCCAAGTTCTCTCACGAAGCAGTTGCTGGTGCTGCTTCA 
TTTGCTGCTGT 

CAAGTTGTTTGAAGATAGACAAAGAAGAGAAGGGAAACCAGTTAGTCACGCCTTTGCTAAAGAAGCTTT 
AGCTGCTATTG 

CTGGTGGAGAAGTCGACAAATTATTTGAAACCAAAGGGTTGGACTATTTGGATAGAGAGAGACTTAGAG 
ATCAAGCTATC 

AACAACGCTCAAAGAGGTTACGACGACCATTACGGTCAACACGAAGAATGGTCTCCAGAACACAGACCA 
CCTTTTGACTA 

CCAAAGATATTAAGTAGAAACTGTGTAGTGAATTTACAATTTTTTTGACAAGAATTAACTTAAACCTCG 
TTTTTAGGTTT 

TGTGCGGCTTTTGTCAATTGACGATCCTGTATATTTCGTCATAATTCACACATTCTTAAAATTATGCAC 
ACATCCTTGAA 

ATGTGTTAATATTCCCAACATTATCAATTATATGTGTTCAGAATTGGTTGCAAAGTTATCAACTCAATT 
CACGCTATATA 

AACCTTACAAATTCTCTACATTTTTATATTTTTTTATATTGGCTTTTCTTTTAGAATCAATCAATACTT 
TTTTTATCATT 

TAGATACATCTTTCATCTATTAATAGATTATCTTTCTATATATCAAAACACGACACAGTCACGTGCCAA 
AAAGGATATAA 

GAAGGAACTTCAGAAAATTAATTTTCTGATTATACTACTTACTAGATTTCATAAAGTCAATATCTGATT 
GATACAACTTG 

GTTCATTATTCATAAAACTTTACAACTAATTCNACAAGNAAACCCNACAAAAAAATCCNAATNAAATAA 




TCNNNNNAATA 

TTATAATTAATTAATTACAAAAAAAAACAAAAAAATACACACACACATACACACACACAAAATCTTGTT 
GCAAAAAAAAA 

AAAATAATAATAATATAATAAGAATTAATTAACAATGTCGTTTCCACGGACACATTCACCAAGACCATC 
TGGTTCACGAG 

AACAGGAAGATCTCACACTGATGATTAAAGCTTTTAGAGATTCAATGGAAGCTAAGCTTGACTTGCATT 
CGCAGAAGCTT 

ACTGCTTTGGTAGCAAACATTCCCAGAACGGACGAAGGGTTTGAAGATTTATCACAAAGGATCACTGTT 
CTTAAAAATCA 

TCAAAAAGCATTTTTGCCCAAACAAGAAAAAGAAATCGGAAGTCTTCTCCACAGACAAAGAGAGGAAGA 
AGGTGATATTA 

AGGATTTCAAAACAGTCGTTGGTGAAGAAAAAGAAGAATTGCACCAGGTTGAAGATTTCGTTTTAAAAG 
ATCAAGAAGAA 

TTACGAAACGTCGAAAAGAAAGTTTTGAAAGAAGAAGAAGAATTGCAAAAAGTGGAAGAGTCAATGGAA 
AAGGAAAAACA 

AGAGTTATACCAGGTTGAAGACTTTATTTTGCAAAGAGATGAGACGGTAAAGAAACTTGGAGAAAGCAA 
TCAATCTCAAC 

AGGAACCATATACACCTGCAACTTCTGGTTCGGATCAGAGATTCAGATCTCAACAACCTAACATTGGAA 
ATACCTTAGCG 

CAGGATCTAGCATTAATTCCAAAATTAGATCTGGAAATTTGCAAAATTGCAGTCAAATATCCAAAATTA 
T7TGAAACAAA 

ATTAAGACCACCACCACCCAGAGACTTTCAATATAAAATTCAACTCACAGACCACACTCAAATTTATTC 
AAAACCATATA 

AATGCAATCAAGAAGAACAAGCTCTCATCAAGGATTTCATCAATGAAAAATTAGAAGCAGGCGTTTTGG 
TACCAGCTCCA 

ATTGATGCTTGGTTACACCCAATATTTCCAATCAGAAAAACCAATGCCAACCAATCCTCCACCAAAATA 
GCAGTTGATTT 

AAGACGTCTCAATAAGGTCACAGTACGAATGTACACTTATCCAACAGACACAAAAGACCTCTTATCCTC 
ACTAACAGATT 

CCCACTATTTTAGCGCTTTAGACTTAAAGAATGCGTTCTATCAGGTAAGCATACACAAGGATAGTATAA 
AATATTTTGGG 

ATTTCAACATCCGAGGGGAATTATTGCTTTACAACTTTACCGTTTGGAGCAATCAATTCCCCAACCATC 
TTTACTAACTT 

TGTGAGACAGATTTTAGAGGGGATCCCATGTATATTTATATACATGGATGATATCCTCATCCATACTAA 
AACCXXACATG 

ACCACATGTCATTACTCAGGAGAATCATGGAGAAACTAAATGAGCATCAGTTTCAAATGAATTATAACA 
AGATGCAATTA 

TTAACAACAAAAATCAATTTCTTAGGGTACAGCATTCAAGCGAACAAAATATCACCAGATATTTCCAAA 
ATTCAAGCAAT 

ACAAAATTGGGAATTGCCCACGACCACTACTCAAATCAGAGCATTTGTCAATTTCAGCAACCACTTTCG 
CATCTTCATCC 

CAGAAATAGCAAAATTTACTAATCCATTAAATGAATTATTGAAGAACAACAATGGTAAAAACATAAAGA 
TTGAACACACC 

CAAGCATCCATTGATGGTTACAAGGCATTAAAAGCCGCCATCATTGGATTGCCGACGCTTCAACTTTAC 
AATCCAAAACT 

ACCAACCATCATTTTCACAGATGCTAGCCACATGGTAGTAGGAGGATATTTATGTCAACCAACATTCAG 
AAATGACAAAG 

AAGTCCTTGTCCCAATTGCATTTTCATCACATAAATTAACAGAAACACAAAGCAGATATGCTGCTATGG 
AAAAGG AAC X T 

TTGGCAATTATTGTGATATTGGAAAAATTTAGATATCACTGCAGCAATACGGTAGAGATCTATACAGAT 
TATCAAAGTTT 

GGCATCATATTTAGATAAGAAAACTACTCCACCACCGAGAATTGCTAGGTTTTTAGATCTAATTGGATC 
ATTTTCCCCAA 

AAGTGTACTATTTAAGTGGAAAGAAAAATTTCGTTGCTGATATCATTACAAGATATCAAACTCAAAATA 
TTAAGGAATTG 

GTAGATGAAGACAAGATACTAGGACAGACTTTTACAGTCAAGAGAAATTTGAAACAACAACTATTACCA 
AGATTGGAAGC 

AATTGAATTGGAAAATCTTAATGAATCACAGGTTCACAAAATCCAAACTTCATTAGAACAACAACAACA 
ACATGATTTGG 

AAGACAATGATGAAGAGTTACCTCTCCAACTGTTTAAATTAATGAATGATGAGTTATTTGTAATCATTA 
ACAACCAACTT 

TTAAAATACCTTCCAAGACTGGAATACAATGATATTTGTCAAACAATCCATGACAAACACCATCCATCA 
ACTAGAGTAAC 

AGACTACTTATGCACACTCGCATATTGGCATCCTGACCATCTATTAATTGCTACAAACATTACGAGAAA 
GTGTCACTATT 

GTCAACTAAACACGTCAATTCGTGAGGCCATTAGACCATACCGACCACTTGAACCACTCAAGGCATTTA 




GCAGATGGGGA 

ATGGACTACTCTGGACCATACTTTAACACAGTCCAACACAGGTACATATTAGTAGCCGTGGAATATGTC 
ACTGGTTTAAC 

TATTGCAGTACCAACATTGCACAAAGACGCAGATAACGCAATCAGTCTTTTACAATCAATCATTCTGAT 
CATGTCAGCAC 

CTACAGAATTAGTTACAGATCAAGGTAAAAAAATTTTCATCACAAGCTTTGGCTACCCTATGTGACCAG 
AATAACATACA 

ACACCATATTACCTCCGCCCACCACCCACGTGGGAATGGTCGGGTTGAGAAGGTGAACCACCTATTGAA 
GAAAATATTGA 

AAGCATTAACTAACGATACGATGCAAGACTGGGATTTAAAACTATATGACGCTTTAAGAATCTACAATG 
CTACACCTACA 

ATTTTTAACTACACTCCACTTTATCTTGCACTTGGAATTGAACCACACCATAATTTAAATCAATTACAA 
AAAGATTTAAT 

TGAAAATTTGCAAAAAGAATTGCCCCCAGAGGTCCAATCCACAGAAGAACACGAAGAAAACCCAAATGA 
TGAACAACAAG 

AAGAGGGCAGAGAACAACAAATTTCAAGAGAAGAACAACAGGACGGCAGAGATCTTGTACACTTAAGAA 
TTTACGAATTG 

GAAGCAATTAAGAAAGCTCGCAAGTTACACACAAATTTGAAAACACGAAGAAACGCAGTCCAAAATATG 
TTAAAGGAACC 

ATATGGCATTCCAGCACTTTTTACAAAGGGACAATGGGTATACAGAATTAGAGCTAAAGCACGAAAATA 
TGAATCAAATT 

TTGATGGTCCATATCAAGTTCAAGAAGTATTAGGTAAAGGTGCTTATAAATTGAGAGACATCACTGGAA 
GAGAAAAAGGA 

ATCTACAATCAGGATCAGTTGAAGTTAGCATATTCAGCAGACAACGATCCAATACAGGTTTTTAGTTCT 
TTTAATAAAGA 

ATATGATCGAGTACAACAAAAATTGTTAGACAAAATTCAATCAGAAAGAGATCATCAATTAAATTGTTT 
GTCAGTCCAAC 

ATTTACACAGACAAAGAAGGTTACTCGATATATCCAGCTGTCTTGAGCAAATTCTGCAATAATTTCGCT 
AATCATTGGAG 

GAAAGGGTAGATGACGATCCTGCATATTTCGTCATAATTCACACATTCTTAAAATTATTCACACATCCT 
TGAAATGTGTT 

AATATTCCCAACATTATCAATTATATGTGTTCAGAATTGGTTGCAAAGTTATCAACTCAATTCACGCTA 
TATAAACCTTA 

CAATTTCTCTACATTTTTATATTTTTTTATATTGGCTTTTCTTTTAGAATCAATCAATACTTTTTTTAT 
CATTTAGATAC 

ATCTTTCATCTATTAATAGATTATCTTTCTATATATCAAAACACGACACAGTCACGTGCCAAAAAGGAT 
ATAAGAAGGAA 

CTTCACTGAAATGCAATCACTTCGCATTATTCAAGATCTTTTTCTATTGTGGCTGGTTTTTGGTGATTG 
CTATGTTTGGT 

TTTTTTTTTCTGGAACACAAGCAACCAAATTTTTCAACTGTTACGTCACACATTTACTGTCACACTCAC 
TTACTGGCACA 

CAAAGAACAAAGCAATCATCCGGCGTAAACTTTTGGTCTTTGAGATGCAAAAGTTGCAAAGCAATTGGC 
ACTTCTACTAA 

GATGGTTCCAGTAAAAATTGTGTTTTATAGTACATCAATAATCAAACAATACTTAATGATGTAACAATA 
CCTTAAAAAGC 

CCCCACTATATTTCTTTTTTTTTTAAGTTTGCTATATAATTTATTATGTGTTATTATTATTGACTTAAT 
TGTTAGCATTT 

TATTGCTTGAGATCGTTTGCTTGTCACTCCACCCTGAAGAAAATTTGAATAATTGCTATTAATTTATTT 
ATTTCTTGGAC 

ACACCCCGTATTGTCGTATGGGTATAAATTCCGTTTCATTTCTCCTCCCTATTTCATATTTCATAACTT 
CTTAAATCAAT 

ATTCAAACCAACTCCAAATTATAAACTATCAAACAAAGAAACAAAAAAACACACAACACA 



>retrotransposon_15 POL protein 916aa 

MSFPRTHSPRPSGSREQEDLTSMIKAFRDSMEAKLDLHSQKLTALVANIPRTDEGFEDLSQRITVLKNH 
Q 

KAFLPKQEKEIGSLLHRQREEEGDIKDFKTWGEEKEELHQVEDFVLKDQEELRNVEKKVLKEEEELQK 
V 

EESMEKEKQELYQVEDFILQRDETVKKLGESNQSQQEPYTPATSGSDQRFRSQQPNIGNTLAQDLALIP 
K 

LDSEICKIAVKYPKLFETKLRPPPPRDFQYKIQLTDHTQIYSKPYKCNQEEQALIKDFINEKLEAGVLV 



FIGURE 33 



p 





APIDAWLHPIFPIRKTNANQSSTKIAVDLRRLNKVTVRMYTYPTDTKDLLSSLTDSHYFSALDLKNAFY 
Q 

VSIHKDSIKYFGISTSEGNYCFTTLPFGAINSPTIFTNFVRQILEGIPCIFIYMDDILIHTKTLHDHMS 
L 

LRRIMEKLNEHQFQMNYNKMQLLTTKINFLGYSIQANKISPDISKIQAIQNWELPTTTTQIRAFVNFSN 
H 

FRIFIPEIAKFTNPLNELLECNNNGKNIKIEHTQASIDGYKALKAAIIGLPTLQLYNPKLPTIIFTDASH 
M 

WGGYLCQPTFRNDKEVLVPIAFSSHKLTETQSRYAAMEKELLAIIVILEKFRYHCSNTVEIYTDYQSL 
A 

SYLDKKTTPPPRIARFLDLIGSFSPKVYYLSGKKNFVADIITRYQTQNIKELVDEDKILGQTFTVKRNL 
K 

QQLLPRLEAIELENLNESQVHKIQTSLEQQQQHDLEDNDEELPLQSFKLMNDELFVIINNQLLKYLPRS 
E 

YNDICQTIHDKHHPSTRVTDYLCTLAYWHPDHLLIATNITRKCHYCQLNTSIREAIRPYRPLEPLKAFS 
R 

WGMDYSGPYFNTVQHRYILVAVEYVTGLTIAVPTLHKDADNAISLLQSIISIMSAPTELVTDQGKKIFI 
T 

SFGYPM 



FIGURE 34 



>retrotransposon_16 3470bp POL protein: 309-2552 

GTATATTTCAAGACGTTATTTCTTGTGACCCTTGGATGACTACTCAAAATACTTGACAGTTCAACCCAC 
TATGCAACAAA 

TCTGATGCTACTGCCGAAATTATCGAATTCATCAATCATTGGGAAAAGTTCTTTCTGGGAAATGGCAAT 
TACCATACGAA 

AATTCTCCGGTCGGATAATGGAGGGGAATTCTTAAACAAAACATTGACTACCTATCTTGATTCAAAATA 
TATTACTCACC 

AAACCTCCAATGCCTATGAACATCATGAGAATGGCGCTGCAGAACGAGCTATTAGATCGGTTAAAGACA 
TGGCTCGAGTA 

ATATTGCTTCAATCCAAATTACCAGTGCCGTTTTGGTCCCTAGCAACCCGATGTGCTGCGTTTGTTATG 
AATCGTCTTCC 

TCATAAAACAATAAATGGTAAGATTCCTTATGAAGTATGGACTAAACAACTTGTCAATCTCAAAATGAT 
GAAACCGTTTG 

GCTCTCAAGTATATGTGAAAATTCCTATTGGAGTCAAAAGTTTTTCTGCACAAGCACTTTCTGGAATCA 
TGGTGGGATAT 

GCCACTAATAAGAAAGGCTACCTTGTATATGATCCCACACAAAATCGAATATTCACATCCTCACAAATA 
ATATGTCATCC 

GAGCATTTATCCAGCAGCCAACCTTACGTTTAACGAACCCTTAATTATCTCATCGAAAGTCACGGCTGC 
TCATCTTCACC 

CCCTTACCATTTCCAATTTAGTTATTCCACCTACCAATGCTGTATCTGAGACACCTCTTGCAAATTGTG 
TGCTCTCCTCA 

AATTCGTCAGTATGTCCCAAAGTTTGCCAATTACAAACTGTCTTGGAACATGGGGAGGATAAAATATAT 
GCACTGATTAT 

ACCAATATCGATCGGCAATATGAAACGCACAAGAACAAATGAAAACAAAATATGCCAGCTAGATGAATC 
GAACAATACCA 

CCATACCAGATAGTGTAATCTTATCGGCTAACAATGTGTTATTAAACTTAGAATCGAGATCTTCCATTC 
CCAAAAGTTAT 

AAGGAAGCTATAACATCTAATGAAAAATCCAAATGGGCTGATGCTATGGATAGCGAGTTTAATTCATTA 
CAATCCAACAA 

CACGTGGTCACTTGAACCACTACCGGAGGGACGCAAAGCTATTGGTGTCAAATGGGTTTATACAATCAA 
GGACACCGGTC 

GCTACAAGGCTCGCCTTGTGGCACTTGGTTATCGACAACAGGCTGGTGTGGACTTTCTCGAAACGTATG 
CTCCCGTGATT 

CGTGGAGAATCAATCAAACTAATCTTTGCACTCGCGTCAAAATCCAAACTAAAGATTCATTCCATAGAT 
GTTACCACAGC 

TTTCCTCAACGGGGAAATACTGGAACTCATATTTGTGAAACAACCTCCGGGATATGAAGATAAGAAGCG 
TCCTAATCATG 

TTTGTAAGCTCAATCGCAGCTTATATGGGCTTAAGCAGCTGCCACTAATGTGGAACATTAAATTAAATG 
ATGTACTTATA 

AAGGAAGGTTTCCGTCGACTTGGTGGTGACTTAGGGATATACATTAGTAAGGACAAAAGAACAATAATG 
GGAGTTTATGT 

TGACGACATTCTCATTTGTGGACCTTCTGACAGTGAAATTGAACAAGTAAAGAACAACGTGAGAAAATA 




CTTCTCAATAA 

CTGATAATGGATTATGCCGAAAATTCCTTGGAATTAACGTCTATCAACAAGCAAATGAAATAAGATTAA 
GTTTGAATGAT 

TATATAAGGAGAATGATTGAGGAGTTAAAATTATCTGTCTCAGAAACAAACCCAGTATCTATACCATCT. 
GATGTCAATTA 

TGAAATATTTAAAGTTAACGAAAATGATGATGAGAAACCATGTGATCAAACCAAATACCGAAGTTTGAT 
AGGCAAGCTCT 

TGTTTGCCAGTAATACTATAAGGTTTGACATCGCCTATTCTGTCAACTCCCTATCCAGGTTTATCAACG 
ATCCCAAAGAA 

AAACATTGGATTGCAGCTGTCAAGGTGGTAAAATATCTCAGTGGTACTCAACGGTATGGTATTTGTTAT 
AACGGTAACGG 

TGACTTGAATATTTACGCTGATAGTGATTGGGCTTCCACTCCATCTGATCGAAAGTCTATTACGGGGTA 
CATTGTTACCT 

ATGCTGGAGCGCCGATAAGTTGGCGTTCCAAGAAGCAGAACGTGATAGCCTTGAGTACGACAGAAGCGG 
AGTTTATGGCT 

CTCACAGAGTCCATAAAGGAAGCCCTTTGGCTAATATACATTTTTCGAGATATTAATGTGATATTGAAA 
TTACCAATTGT 

GATATATGAAGACAACCTACTGTGTCAGAAATTACTTGAAAATCCTCGATTCCATAATAGGACAAAACA 
CATTGACTTGA 

AATATAAATTTACCAAAGACCATATAGAAGCTGGTACAATCAAAGTGGAATCAACTAATTCAGCAGATA 
ACTTAGCCGAC 

ATGCTAACTAAACCTTTACCAAAAATTAAATTTAAACATTTAAGATGGCTAGCAGGATTAAGACCTTTA 
GATTGATTAGA 

TAATGATAAAATGAAATAAAGATTAATTTGGAGATGCAGGTTGATGGGGAGGATGTTGGAAAAATGAAA 
TATGATCAATC 

CTGCATCTAGAACCTGTGGCAGAATGAAACCTACGAGATTATGAATGACTTGTGAATACAAGTTGAATG 
TTACAGAATGT 

TACCAAGAAGGTTACACTTGAATATATGAATGACTAGAAAGTGAATTGAATGTTACAGAACCTGAATAA 
CAATGTTACAC 

GAATGTGTGAATGATATGAGTTTATCTATAGTAATGTGACATATACACAAAGGTGTGAATGACCGAGAA 
AACAGATGTTA 

CATTACGGGCACTGGAGAGTGCAAGTCTAAAGAATCTTGGAGTAGAAATAAGTAATATAAAAAGGACCA 
AAGATTCTTTA 

GAGAAAAGTAAATGAAACTAT AT TAGAT TT T ATAT AACTAACTAACAAATAAATAAAAAAT AT AATATG 
TCTACAATGCC 

ACCAACT TCCAAACGT ACTAGAAAGAGAAC TAGAACCGATGAT AATGCTGAACCAACTAT T CAAGATCC 
TTCACCGCCAC 

TTGCTAATGTTGAACCCACAATTCAAGAGACTCCACCGCTGGTTGAAGTTAGTGATGAGACTAATTCAA 
CTGAAATCAAT 

GAGACAAAT AGT AATACTCAT GAAG AAACAAAT GTATT AACT AAT G TGCACTCCT CTCCAATCGAGACA 
GTTACTGAGAG 

GAACTTCAATTTTCAACAATAATAATATTGGTTGGATTTACACGTACGTTGTTGTTACAAAGACGTGAG 
CAGAGTGAGAG 

AGATCAACCTTCATATTCAATCTCATCTCAATCAACGCTCAATTTTTTTTTCTTCTCCCTCTCTTTGTT 
GTTTAACTAAG 

TTTGTTCCCTTCCATCCAAGCAAGTTAGAA 
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>retrotransposon_16 POL protein 7 4 8aa 

marvillqsklpvp™slatrcaafvmnrlphktingkipyevwtkqlvnlkmmkpfgsqvyvkipigv 

K 

sfsaqalsgimvgyatnkkgylvydptqnriftssqiichpsiypaanltfnepliisskvtaahlhpl 

T 

isnlvipptnavsetplancvlssnssvcpkvcqlqtvlehgedkiyasiipisignmkrtrtnenkic 
Q 

LDESNNTTrPDSVILSANNVLLNLESRSSIPKSYKEAITSNEKSKWADAMDSEFNSLQSNNTWSLEPLP 
E 

grkaigvkwvytikdtgrykarlvalgyrqqagvdfletyapvirgesiklifalasksklkihs-idvt 

T 

aflngeiselifvkqppgyedkkrpnhvcklnrslyglkqsplmwniklndvlikegfrrlggdlgiyi 
s 

kdkrtimgvyvddilicgpsdseieqvknnvrkyfsitdnglcrkflginvyqqaneirlslndyirrm 
I 



EELKLSVSETNPVSIPSDVNYEIFKVNENDDEKPCDQTKYRSLIGKLLFASNTIRFDIAYSVNSLSRFI 

DPKEKHWIAAVKWKYLSGTQRYGICYNGNGDLNIYADSDWASTPSDRKSITGYIVTYAGAPISWRSKK 

NVIALSTTEAEFMALTESIKEALWLIYIFRDINVILKLPIVIYEDNLSCQKLLENPRFHNRTKHIDLKY 
FTKDHIEAGTIKVESTNSADNLADMLTKPLPKIKFKHLRWLAGLRPLD 

FIGURE 36 

>retrotransposon_17 1550bp LTR zeta: 887-1394 

^^^^^??™^"<^^"CTC^TTCCCCTTTTTTTTTCCTTTCTTTGTTTTGTTTTGTTTACCTTGT 

cStgccgS''''''^^'''''''''"''''^''''''''''^^^'^''^"^^''''^^^ 

CAGGGG^^Tcf^'^''''''^''''''^^''"''''''^"^^''''^''"^^^^^ 

AT^lT?G?f"''"""""^^^^*="^^'="^<=^"^^^^=C=^'=GG=TATTAATAGATA 

^cagIttIIc'''^''''''^^^^ 

ItIgIt^Igt'"''''''''''^''^^^^ 

t^caIIg^'''^'''''^'''''^^^^^^ 

IIctIItgI^'''''''^''''^''''''''^''''''^^ 

ctIIIgtaIaI'"''''''''''^^^^ 

SgtI?S''''''''^''''"^'^''^^'''''''''^™^^°^^^^^"tc^ttagtctagatcaagc 
ItgttIcII^'''''''^''^'''''''''^'^'''^''^^^ 

tg^aIIcT'"'''''''^^^^^ 
gcctctgtgattacggcaattatttttacc 
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>retrotransposon_18 2132bp LTR zeta: 1418-1926 

llVrl^G^''''^''''^''''''''''''''''''''''^''^''^^^ 

aaaaaaagggagaaatgaatattgaattattcagcttttatattgctgatagatgttgaaaaaaaaa 
gIggc^Z''''''''''''''^''''^'''^''''''''''''''^^^^^ 

^CGl?^??r''''^''''''^^^''^^^'^'^"=""^^="^'=^"A"C'^'^^TATATTACCGTATTGGG 

ttattagttctccccgatggttcgattttgctggtgcaaaaatataaatccgatataactttattggtg 




CTTTGATAAAT 

CCGTTTTATAAGTTGGTAGACATATACAGGATGATAATAATTTAACGGATTTATAAGTTGGAATCATTT 
GGATGAATCCG 

CTTGGGGAGGCGTTTTCCAATTTTAGAAGTTTAACTATCAATTTTATGTGACATCCGAGTATACACATT 
TTGTGAATTTG 

ATCTTGTAAACTCACTTGGTGTACCATGGCATTTATAACAACACTTTCTAGAATCGGCTGAGTTACATG 
CATTTCCTCTA 

TTTGTAGATTAATGGAAATTCATGAAATCGTTCACATTTTTTTCTATAATGAGTATCGTTCGGTTTCCA 
TAAGTAGGGGA 

CTAAAAAATAATTGATATCTCTAATCAGTGACAGCTCTAGTCAACTTGACCGTAATGTTTTGACGACCA 
TTATATTTCTT 

GTTTGAACTATTGATTTATGAGTGTTGTCGTAACAAAAGATCAATTCCCGTCAAAACGCATTTGGCACT 
TAATCTTTGAT 

TGAACCGATTTTGATCTCAAAACATAGTACCAAGGTCAATTATGTTCGCTAATGAAAGAAAGCTGTGAC 
GAAAACCTCAA 

ATTCATGAAGAAAGAATTACTGTTGTGGAAAATAAAAAAGTCTTTCTTCTGATACTTTACAAGTCCCTC 
AACCACAAATA 

CAAAAATGAAAGTTACCCATCGATCTTTTTCATTGGTTAAGAATTAATACGAGAATATCAAATTATCTT 
AGAGAGGGTCT 

CACAGAGCAACTTTCTGAGGCACACGGTCACCAACATGATTTGTTATAAAAAATTCAACCAAATTTTGG 
AAAAAATGAAA 

ACAAAACAAAACAAAATCTGAAACATCCCGAAAGTCACAAATGCTTGATTACTTAAAATTACTTATTTG 
CTTCAAGACGC 

TATT AT TATTAT TAT GACATAATAC T ACTTGAAT AACAGTGAACTGT AAT T GT AT TAAGAACAAAT CAT 
AACAAAGGAAG 

ATGATGACGATGATGATGACCCCTTGAAATATCCCAGGGCACATGCATTGTGATGATTGTTGTAATATA 
GCTAATGCTAA 

TTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATT 
GTTAATACAGT 

TATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTGAAAAC 
CAACTAACTAC 

CGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGTTAGAAAGAGAAA 
GGGTGGATTAT 

AAATATGTGTAAAAATCCCCTTTAGAGACTAATCACTAGAAATCTATTGATGGTTTCATATATAGAGAT 
TAACGATTATA 

TTTATAATATAAGTTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTATAGTATGTCAGAATCAGATC 
ATTTAAACTCT 

ACTAATAATACAGGAAACAC T T TCATT AG T CT AGATCAAGCCAGT ACAAT AAT GGCAGATCAAACTCAA 
GGAGCTAACCC 

ACAACAATTACCATATTATATGAAGAAGACTATAACAAAACTGTAGATAGTAGGGGATTGGGTATTTCC 
GGGGGAGTAGA 

AGTATTGGGGTTATCTAAGTCCATCTTTAACCACCCAACAATCCAACAACAACCCAACNACGTTTTTCC 
CCAATTCTCNG 

GAGATNACTTGATTAACTTNAAATTTTTCCNTGGCCAAAAAATTTCCTTTTC 



FIGURE 38 

>retrotransposon_19 1734bp LTR zeta: 767-1274 

AATAACCAACCAGCTGCTCATTTTTAGATGTATGTATTTTATAGGAAAATTGAATAACTTGTTATTACT 
ATGGCCTGTTT 

TCTAAAGCCAAGTTGTTTCTTCTTATATTTTTTTTTTCTAAACACCGTTTGTTGAAGATGGCTTTATCC 
GTATACTATTG 

GGCGTCGATTTTCGCACAAAAGCTTTTATCCACGGAATATTTGCGATAATATAGTACAAAAGTGTGTTC 
TAGTCTTGTAA 

ATGTCCAATATTTTTAGTACAACGATGGAAACCCGTATAGCGCAGACACAGTTTGGATAGATTTACGTA 
GGTGATGAGGA 

GTTAAATTGAATATTCTTGTATAATTTCAAGAGCTGTGACTACTATTTAAATTTTTTCCACTTCACTTT 
CTTTCTCTTCT 

TTGACATTCAAGTTAGTCTTTCTGTATTTGAATAATACTACATTTATCATGTCTCACGTCTCAATTGTA 
ACTGGTGCTTC 

TAGAGGTACGTTTTAATGAACAAAATCTATGATGTTGAGACTTCCAATTTGAACTTTAGTACTAACTCA 
AATAAAGGCAT 

TGGTAAGGCTATCGCCGAAATTCTTTTAAAAACTCCATCTTCAAAAGTTGTGATTGTTGCTAGATCTCA 
AGCTCCATTGG 



2g ^co/TtUj 



^TCTTTCCAAAAGCAACACGGCTCGGAC^^ 

GCTGTTGAAACTGCCATCTCCAAATTTGGTCAATTAAATGCTGTCATGTTGTAATATAGCTAATGCTAA 
TTCTTGATTAG 

TGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATTGTTAATACAGT 
TATTGCTGTTG 

ACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTGAAAACCAACTAACTAC 
CGTATTAAATT 

ATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTAT 
AAATATGTGTA 

AAATCCCCTTTAGAGACTAATCACTAGAAATCTATTGATGGTTTCATATATAGAGTTTAACGATTATAT 
TTATAATATAA 

GTTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTATAGTATGTCAGAATCAGATCATTTAAACTCTA 
CTAATAATACA 

GGAAACACTTTCATTAGTCTAGATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGTTAACCCA 
CAACATTTTGT 

AGTCGTAAACTTGAAATTCAAAGAGAAGGGGGGGAATTAAATTGGGTGCAACGTGTTTGTCAAAAATTT 
GGTGTGAAAAA 

AATTAATTTAACACTCTGCATTGTACCATAGGGAATATAATACCCAGAAATAAGAGAAATTATCACGTG 
AGACTAAAACT 

AAATATAATAAATTAATATCACAATTGAGAAAGACACTGAAACTAACTTCTTGGTGTATTAATTTTCAA 
CACTTGATCAC 

AAGTGCGGGGATTAATCATAATTGCAAAGAGTGTGTTAGAAAGAGCGAAGGTGGATTATGAATATTGGA 
GAATCCTCTTT 

AGAGACTATCCGCTAACAAAATAGATGAACTTGCTCAACAGAAACAACTAATCGACTAACTGACTAAAA 
TTAATATACTA 

AGTATAGATTAAGTTATCACGTTAATATTCTATACTATCCATCTCCATCACTTT 

FIGURE 39 

>retrotransposon_20 5734bp LTR zeta: 3344-3851 

GAGATTGTAGTGAAGAATTCAGCTCATTATTACTGTTTTGTCGTTGCTGGAAGGAGGAGGGATAATTCA 
ATGCGCCACAA 

CAGTGTTACTATGCATGTGGTTCTGACTGACTGATATTGTTTAAAAATTAACCAGCTCTCAAATAACAA 
AAGTTTAAATT 

TTCAAGGTTTGTAAACATGGCAGCTAGTAGT^^ 

TGAAGCATTGTTTTAAATTTTCAAATTGAAATTCAATTTCATTACAAATGGATTACTAACGGAATTCCT 
AAGCTCAACTG 

AATACCGTGATTGAAACATTTGAATTTGTATCTTTTAGATTAGCTATTTTTACTTTTTTTGTCATTGTA 
GTTGGTTATGA 

TAATTACAAGAAACTAAAGTTTAATATTTTAATATTCATTTTCTTTTTTGGCCAACTTGCAAATAACAC 
AC AAAC C C AAA 

ATTAAATAATTAGATTTAATGCATGCATAATTACACAGAATGTTTAGCCTTAACAAGTATTCTAGAAAC 
AAGAAAGAAAA 

AATGTCGTCTTGGCGTTTATCTTAATTGTATTCTGTAAACTGGGTTAATTCTTATTTCCAACTTTTCAT 
TTTTTTGGATC 

TTGTATGGAATAAAAATTAAATATGGTATGTTTTAGGGTTGTATTAACAATACTTACAATTATCAATCA 
TACAGCTTTAC ^ 

TATTTTTATTTATCAGCAAATAGGGGAATTCAAGTTGCATGTGTTATTCAGTGGCAGTGAATCATAAAA 
C AGC C AAC T T G 

CAGCTTATTTCACTCCAGGAGCAATCATCACGGAATTCCGTTTCCCATCTCATTTTCATACTCTGTGGA 
TTATGTATAGA 

GGCTATTTACAATATCACCAAGCAGTAAAACATTCTCTCCTCAAAATAACAATAAGATTAGTCAAGATG 
AACGACTTGAA 

TCTATTCATATGCATTACACATTTAGTTTCTATTACAAATAGTGATGCAATGGTGCAAGATTACGTCTT 
GTCTGCACTAA 

CTATTTGTAACGATGATTATGTGATCAAGAATTGGAATTCTTATTATATTCAGTCGTGAGTGTAAGCTA 
TTTCGTTAGGG 

TTATCTTAACTCGAAGTTAAAGTTCCAAAACTATTCCATTTGGAGTTTCTGTTGTTGAGAAATACAAAA 
TACTCTTCTTG 

GTGGGGAGGAAATCCATTAATGATTATAAAATGAAACTCTTGGTAACCTAATTGAAACACCACATTCAG 
TACATTTTCAA 

CCGTCACTATTATTATTGTGGCAAATGGATTAAACAATAGACCTAACTTAATCTAATGGAAATTTTAAA 



TCCATGAAAGG 

^^^^^^f^^^'^'^'^^'^'T^^C'^GTCCAGTAGGGGGTGCCATAGTCTTGGGTGGTGACAAAAAA 

^cSgg^Ic''^''''''''''''''''''''^"'''''''''^^^^^''^''^^^^^^ 

^CGTCACT^^r'^^''^'''''"''^''^"''^^''''"^^^^^^^^^"^^^^^^ 

^^^Igtc^a^'''^'^'^'''^''''''''''''''''^'^^''^'''^^^''^'^^"^ 

^Sctg^g''^^'''^''''''''''™'''^''''^^^ 

I^^gcIgT''''^'''''''''''^^^^^^ 

tc'^tIa^ggg'''''''^'''''''^'''^^ 

^^^^^^^^^''^''''''''^^'''''^^^'^'^'^^^^^^^^^^^T^TTAAAATAG^ 

S?CTTGcI^?^'''''^^'''^''^^''^''''^""''"^^^''"°^^"^'=<=^TTCCTCCACTCCTTTCT^ 

T^^GC^CT^c""^'^'''^^''^''^^^''^''"^^^^^ 

tgtIttaTaIc'''''''''''^''''^^^ 

^I^^^^^Jf^^^^^TTTGACCACAAAAAGTTGTCTGGACGCCTCAGT 

TTGAAATTAGTTTTGGGA 

^TATAGCT^"''''^''^''^'''^''^""''^'''''^^''''^''^^^ 

G^^I^^^^^<^^"^^^^TGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATA 
GS?cSf''''"''''''^''''™^^^^™"''"^"^^^^^^^'^<^"'^^GTTAATTGAATAGT 
^Gl^GGGTr'^''^''"*'''''^^'^''''^^^''"^^^^"^'^'^^^^^^^^^ 

gaIItI^Ia''''''^'^''''''^^^^^ 

^^^™?^^^^^^<^TTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTTTAGTATGTCAGAATC 

CTC^GGA^?'^''''^''^'''^^^'^'"'^^''^'^^""^^^ 

^GTTGC^Tf''''^"''''"'''''^"'^"''''''"^^^^^'^^'^'^^ 

GTCCGTAAACAATTATACAACAATTTAACCAATGCAACATCAATTGAAATCAAGAATTCAACACTTGAA 



f'9 



CATTTTTCTTG 

TTTTCAGATCTCGTCAAAACACCAGTCAATAAAGCTTGGAAAGTTTTAGCACAACCATCAAAGTAGAAA 
GCCTAACTTAT 

AGGTTCGAATTACGTGAATTTTGGTTTCACTAATCACGCCCCAAAAAAATTCANAAAAGCTTAGTATGT 
AACATTTATTG 

CAAATTTTTTATTGTTCGTCATAAATGATAATTAGTAAATGAGGTTACAGAATAGTTATGTTTTACTTC 
ATAACCAATTC 

TACTATTTTTTTTTGTATTATAACCTCGGATAACACAAACAAAAAAAAAGTACTACTACCAATTAATGT 
TTAGTAGATTC 

TACACAAACTTGATAATGCGGGAGTTATTTTTTTTTGAAGCCACTTTATTTTCAGCCGACTTATCTAGC 
TACGAGACAGA 

ACAATACTTAGCACTAATTCTTAAAATTCCATACTATTTCTATCATTCAAAATGCATTTTAACAATCAA 
TTGTCAAATGT 

GAATGCAACAAAGTCCTGAATTTATAAAAAAAAGTAGATCATTGATGCAAAAAGTGAATTCTTTGGAAA 
GCTTTACTTTG 

AACCGAAAGGAGAAGGCAAGTCGTGCAACAAGTTATTATTTCGTGTACAGTATCCAATTTTGGTTTTTC 
GACACTAGGTC 

TAGACTCCAGAAACAAAGTCCTAATAAGAAAGGTGTTCAAAAACAATTTAATTTTAGTAAAAAAACACA 
ACCTGCATTTC 

GCAATTTATGACCAAATTGAGTTAGCTAATTATAGGGCATCAACAATAATATCCAGCCTCACACAAATC 
AGAAACAGTCA 

TATAACAACTCGAATGCAAATATCAAGACTATGTTATGATAAGAGTAGTTGGGCCAATAAGATAAAACA 
GAAAAAGAAAA 

TTTTATATTCTTTAAATCTTTGGGTGACAGATCAGCTCCAATTCTCTTGAAATTGGCACAAATACTTCG 
TCTTTTTTCAT 

TCATCAGTATATCACGTGTAGAATTGATGCTGATATTCAAAAATTACCCCTAAAGTTGCTTATCAACGC 
AACTTAAGATT 

TCATACAAGTCGATAACGAATCTGAATTTCAGCTTGCTCTTAGATTAAACAAAATGGTAGATTCAATCA 
ATTAGATAACG 

CCAAATAACATTTGATGTTTTGCGGCAATATTTGGATGGTGTCAACTAGGAGAAAA'TTGATTCCCCGCC 
ATATCTCATAA 

GCCTCTAGCTGTCCACTTTTCTAAATAATTGATATGGATCACCACATTGGGGTCTAAATGAAACAACGT 
AACCCGAAAAC 

GTGTCAAATTCGGAATTCGTATGTATAATTCAAACAATACAAGAAATATGGAGAAAGCAGATACACACA 
TACACACTCAA 

AGAGCTTGGTAGAATAACAATAACTTGATATAATACGTACTATTCATACACAATTACTTAATTGATTTG 
CAATCATTCCT 

AAAAAAATTCTCTTTTATTTTTTTTTTAATTGGTAATATCGGTGGTATACAATGATTTACCTAGTTAAA 
CAATTGAAAAC 

AAGAAAGTATAAAATTTCTTCATTTATTTTGCTTACCCTCTACCTTGGTAATTACACCGATGTGAGTTT 
GGAAATCTGAT 

AATCCCAGAAATTGGATCTAATTGGNTCATATTTAGATTTCAACAAATCATAAACAGTTCTAGACTCCA 
TGTATTTCTTT 

TGGTGTGTGTATATTTTTGCCAATGTCTCCAAAGCAAATGGAACTCGTCACTTG 



FIGURE 40 

>retrotransposon_21 ;i875bp LTR zeta: 812-1319 

CCTCCGGCCGCTAATTACAAGGCTGCTTTATATTGTTATACCTTGGGGTAAATGCCCTCTGGCATTGAG 
CTATTTCCAAT 

TCCCACTTCGGTATTTTTTTTTACAGCCTCGTTAGACGAGTTCTTGATATTACTAAATTAGTTGTTTAC 
TGAGTGGCCTG 

ATGGTTCCTCGTCACTCTAGTTTTTGGTCTATATAAGGGTCAGAAATTTCCCTTCTCCTTAGGTCCATC 
AAGTCAAGATA 

TACATTAGTTGGTAGCATCGTATGGAATTTTCGTATGAACGGCATACCAAGTATTAATTTCCGATCGAA 
ATTTTTTAGGA 

CGTCTTGATAATCAGGACAAACATCATGAAAGGTCTATACGACGAAAGTTTACTTTACACAAGGGGAGA 
CCATATGTCTT 

CTTTATTAACAACTAGTTATATAGCGAACAAATAAGTTTATACAGAAATATATGTACACAAACAAAGTT 
ATTGTTTATTA 

ATTATTTAATTAGCTCGGAAGAATAACTCTGTGATACTGCATACATTCAAACAAAATCAATCTAGTTTC 
CAACATCTTTT 

TCACTTGGTAATGTAATTATTCTTGTTCTGGCACCGACAATGGGTATTGTTTTGTAGCTGGAGGACTAA 
TATGGGGTACC 





ACCTCAATTTTTGGATCCCAGCTCCCACGCAGGGGTGGCTTCTGATCTAACTGACTTTCGAAAATATCC 
TGATAGTTTCC 

AATTAATTCAGCAAAATAGCTCTTGTTTGTACCCTTAACCAATGACATGATATCCTTTTTATTATCACC 
GATACCACCTG 

TGTCTTCGTCTTGTTGTAATATAGCTAATGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATA 
TTGTGCACAGG 

TTAACTACCTTAATATAGTTATTGTTAATACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTA 
AAGTGTTAGGT 

TGAGTTAATTGATTAGTGAAAACCAACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATT 
AAGGATAAAAC 

AGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATACGTGTAAAATCCCCTTTAGAGACTAACCAC 
TAGAAATCTAT 

TGATGGTTTCATAGATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATTTGA 
AAGCACTACAG 

TATAGTATGTCAGAATCAGATCATTTAAATTCTACTAATAATACAGGAAACACTTTCATTAGTCTAGAT 
CAAGCCAGTAC 

AATAATGGCAGATCAAACTCAAGGAGCTAACCCACAACACGTCTTCTTCAGTATTAGGGAACAACATAC 
TAACTTGACCT 

TTTCTAGCTTCAACCAAAAATTCCTCTATATCCATTAATGGAATTTCATCAAACTGAGCAGCCCCAAAA 
AACGTTTTGCT 

TCCAAAGTCTAAATGAGCATGGAATTTCCTTATGAAAGGTATACCAAGTATTAATTTCTTATGGAAGCT 
GTCCACTACAG 

CAAAATTCTCTTGGAATGTAATACCATTAAACTGGAACTTGAGGTTAATTATTTGGTTAAAGTTTCTGT 
TGATTTTTGGT 

CCAATAAAGTACCCAAACTACTAGAGCTCCAACAACATTTTCAGAAAATGGCCAATAATACAATAAGTG 
GGTATATTTTA 

TCAAAAGAGTTTATATTATGGTTACTCGACGGGTATTATTCTCTGTTGGATTAAGGCATCTGGGCGACC 
CAGTGGGACCA 

AAATTCCAGAGTAGTGGTTTGGTTTAGGACTTTACCAAGGNCCATGATTAGGGAATATTNTAACCAAAA 
AATTAAAATTA 

CCATTTAATTCNAAAACCTAACCTAAATTCCCTAA 



>retrotransposon_22 1712bp LTR zeta: 672-1179 

TAACCATGGAATTCCTNGAATTANTNATAATTAACCAAATTTTTTAGGGNTTATTAGGACCTAGGATTG 
AATTCCATGTT 

TATTTAATAATTAANCCCCAGTTTGGCCAACTATGAAATAGTATAATGGTTAAATGCAAAATAAATATA 
GTATGAACAAT 

ATGATAGTTTTAGTGTGAATTTTGAATAAGAAAAAGAAGGGATAAGGATATTTTTACTAGGAAACTCAA 
TTATAATTACT 

AATGATAAAAACTCCATCAGCTACTATTATTACTCAAATTTTAAATCATTTGTTTATCACCTACACAAA 
CAGGGATTGTC 

CAATATTGATTACTAAAATTAGAACAAATAAGAGAATATAATTGAAGTTAAATAATTCTTTTACTAAAT 
CTATTGACCAA 

GAACTACATCAAGGGAAAGTGTTGCATATACATCTAATGTTTATTCTTGGTTAGAGTATTGATACAAAA 
TTATATCATCA 

CCAACGAATCACATTAAGGGAAAGTGTTGTGCATATACCTGATGCTTAGTCTTGGTTAAAGTATTTGTG 
TGAAAGGTTAT 

CGTGACCAAAGATTATAGTAAGGGAAAGTATTATGAATAAATCCAATGTCTACTTTTACAGAAGTATTG 
ACATGAGAGAT 

TATAACTATCAAGAATTGCATTAAGGGAAAGTGTTGTAATATAGCTAATGCTAATTCTTGATTAGTGTG 
GAAAGCCTAAT 

AAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATTGTTAATACAGTTATTGCTGTTGACTA 
CTATTGTTATT 

GTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTGAAAACCAACTAACTACCGTATTAAATTATTG 
TATTAAGATTG 

ATTCCTATTAAGGATAAAACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAAT 
CCCCTTTAGAG 

ACTAACCACTAGAAATCTATTGATGGTTTCATATATAGAGATTAACGATTATATTTATAATATAAGTTG 
GTAGTTGCTAG 

TATATTTGAAAGCACTACAGTATAGTATGTCAGAATCAGATCAATTAAACTCTACTAATAATACAGGAA 
ACACTTTCATT 



FIGURE 41 





AGTCTAGATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGGTAACCCACTACAGGTTATGAGC 
CTCGCCCGCTT 

ATTGAATTTAGATAATATAGGGGCAATGAAAGCTTTTGAAAGTGTTGATTTTCCTGAATCATTAAAACT 
AGAATCCAAGA 

TTAATTTTCAAGTGTGGAGAAATGAAATCCTTAGATATGCACGTGGTATTGGTGCTGAGTTTGAAAACT 
TTGTATTGAAT 

GAAACTCCAGCTCACCTGTATGATCTTAGATTGGGAAATATGCTTCATCAATTATTGATTCGCACTGTG 
AAAGAAAAAGT 

TAGAATGCCTAGGCAAGAACTTGGAAAATCAGGAAAAGAACTTTATCTTGATCTTATTAAATCATTCGG 
TACTCAATACC 

CATACGATAAATTTGAGATAGTTAAATACTATTGGGATCAGTTAACAAACCCTTTAATTAATGTGAAGA 
GACGTTTTGAA 

ATTGAAGAAGTATGGGTTCAATACATTAATGCTCAAACTGCAACAGAGAGAGAAGTTCTTAATTCATTT 
GTTTGGTTACA 

TTTGTCAAAATCTATATTACCACAAGAGTACC 
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>retrotransposon_23 1540bp LTR zeta: 467-974 

TGTGGAATTAAGATGACTTTGTGATTAAATTGTTGACTTCTTTAAGCCTTTTAATGTGGAGGAAAAAGA 
AAAATCTATAA 

TTAAAAAAAAAAAAGATAAAGCAGATAATTCTTTGATCTTTATATACTTGGTCTATATGTAGTAGGGGA 
AAGTCGGAGTC 

GGAATTTGAAAAAAAAAGAGAAAAAAGAACGAATATTTAGACTGTAAAATTCAAACCCCTGCTGATTAG 
TATATAAAAAA 

AATGAGTTCATTTTTCCTTTCTTTTTTTTTTTTTCGCGCGGATAGCAACGGTCATTAAGTTAACGAGAT 
AAAAAAGAAAC 

AACCAGATAATTATGAAAAGTTGTGATGGTGTCACGTGCGAACATGAGAGTCATGAATTTTGACGAAAA 
CGTCAAGCTTC 

AGTTTACAAAAGACCTCTTTATTAAAATCGAATTGCTTATAGGGTCGTCGATGATGAGAAGGTGTATGT 
TGTAATATAGC 

TAATGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAAT 
ATAGTTATTGT 

TAATACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATT 
AGTGAAAACCA 

ACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGTTAG 
AAAGAGAAAGG 

GTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACCACTAGAAATCTATTGATGGTTTCATAT 
ATAGAGATTAA 

AGATTATATTCATAATATAAGTTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTATAGTATGTCAGA 
ATCAGATCAAT 

TAAACTCTACTAATAATACAGGAAACACTTTCATTAGTCTAGATCAAGCCAGTACAATAATAGCAGATC 
AAACTCAAGGA 

GG TAACCCACAACATAGAAT ACGT T T T CAACTACT T AAGT AT CCAC T AACC T AAAT T TTT TT T T TAAT A 
AAATTTCATTG 

TATTAGTCTTTCTTACTGCTTTTAATCAACTATAAGTATAGGTTTCCGTTTTTTTTGCAGTAAAATTTA 
TCGTTCAGGAG 

AAATAACAAAATGTACACGACTTATTCGCAGCATTTTTTTTTTTGTTTTGGGTTTTTGTATCAAATTGT 
TACAACAACAA 

CAACAACCTCAATTCTTAACCAAATCTACCCCTCCTATTTTTTTTNCNCATACACACAATACATCTTAC 
ACTATCTTTTG 

ATAGGCTTTATNGAAGANGTATTTANGGNGTGTAATGACAATCTGCTTAACNCATATATNTATNTANNG 
NNNGTNGTCAA 

CAATAGCTTTATCTACTTTTTTTTTTTGGNNACNCCNGNAACTTCAGGNCCACNNNTTTGCCNATTTTG 
GGGCCCCNATT 

NGGAAAACATGGGNATTGGGANNACAGCTTTTTTTAGGNNNAAANGGGTNTTNCCNTTTNTGGTGGGCT 

TGGAAAGNAAC 

AGCNTNTAAANNAATGGGCT 
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>retrotransposon_24 2025bp LTR zeta: 787-1294 




TGGGGAGCAAATGTGAAATTAAAGAGTGTGGTGATATGTAATTTTTTTTCAAAAAAGATTGGATTGACG 
AAGCATTATAT 

ATTCGTCTAAAAACCATTTTTGCTGGTTCCGCAATAAATCTCGGAGATTATTTCTCGATTACCAATTTA 
TGTTGTTTTGT 

GACATTTCTTATATTTTGTTCTATTTTACACGACTATTTATTGTTAATAAATATGTCACCTAAAGAATA 
TTTCTATTTAG 

TTTTACATATGTTTTTTGACGACAATCAACTATTACAAATTAACCTACATTTTTTAATTTGAATATATA 
CAATTTATATT 

GAATTAACATTACCATTTAGTTTTTGATAAGAATAGATTGCGCTATTTCAAACATTTGTTAAATTATTT 
ATTGTGAAACA 

ACTATGTAGAATAAAAGTATGAACAAATTCTACGTTCATCATGTGGGGTGTGCCTTCATATATATCTTT 
GGATGAGAATG 

CCAAGAAAAATGATGGCGTGACAATTCAATACGGCAAAACAAACTAATCCCCTCTAAGATTTTACTAGT 
GTGTTTCCCTA 

TCGTCTGAGGAAAAGGTAACAAAACATCGTTTAACCAATTGGTGTTTGTTACGATGGTGACGTTGAGTA 
CTGCATATAGT 

TGCAACGGCAAATTGCATCCAGCGAGTTAACAGCGAATGGCAAAGTGAAGCCTCCGACTTGTGTTCATT 
GACTACTGGGA 

TTGGACTGGGAATAACGACTTAACTAATTAATGTTCTCGTGGACTCGTTTAGCTAGAACTAACATTTGT 
TATAATATAGC 

TAATGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGCGCACAGGTTAACTCCCTTAAT 
ATAGTTATTGT 

TAANNCAGTTATTGTTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGGTTAGTTAATTGATT 
AGTGAAAACCA 

ACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGTTAG 
AAAGAGAAAGG 

GTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACCACTAGAAATCTATTGATGGTTTCATAT 
ATAGAGATTAA 

CGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTATAGTATGTCAGA 
ATCAGATTATT 

TAAACTCTACTAATAATACAGGAAACACTTTCATTAGTCTAGATCAAGCCAGTACAATAATGGCAGATC 
AAACTCAAGGA 

GCTAACCCACAACAGCATTGATTATATAATCATCTATGTAGCCAATATACACTACCGTCCAAACTCCCA 
CTACACACTTG 

TAACAGTGTTTTACAAATCTATGAACGAATAACCGATTCAAATGACACAATAAAGAACATTTCACCGAT 
TTGAATTGCTA 

ATCGGTACTATAATATTGATGGAAGGTTAAGAGTTTAATGCTACCCTAGGTTTACCGGAGATCAACAGT 
TGCATATACAA 

AACGTGTTATCTGTCTACGAATGGCTTTCTATGTGTATAAAATGTTTCATCAATTGATAATTAATTATT 
AATCTGCTTAC 

TGAGGTAAACCCCTTTTAATGCAATAGCAAATATGAGGTATTTTTTTGCTATTGACATGCGTATATGAA 
TCCATTTGTAT 

CAAATTGCCGATATAATGAAATGGAAATTAAGGGAAAAAAAAAAGTTTATATCCAAATTCATGCGATTA 
ACAGGTTCTTG 

TGATTATAATTGGTAACCCCCTCCCCCCTAAAACTCATATCTGCCAAAAGAGGAGGATATTTGAATATG 
CTATTATGAAC 

CCCATTGATTTTGACTACAATTGGATTTGTCGGGTATTGAAACCCAAACATATTATAATTTGCTATGCG 
TTTAAATCAAC 

CGTTTACTGGTAGATCCTATACTATAAATACAGCCAACAATCCCCAATTGTTCAGATAAAGTAACACTC 
AATATCATTTG 

ATCAATCAATCAAGAGGATTACAAA 
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>retrotransposon_25 3583bp 

AAAANNTTCCCCATNGCCTATTCCTAGGNCCCA?y^CCAGTTGTCCGAAACTCCATGGATGCCAGAAGT 
GGTGGTCCTCC 

GCCGTTATGGTTGGAAAAGAAAAAGAAACTTGACGAATTGAAAGTCAAAGAAGAGCGGCAAGAAAGAAG 
GAAGAAGGGGC 

AAAG AAAAAGGAAG AAG AGGCAAAG AAAAAGGCAGAGGAAGCGAAG AAGT G T T T T AT TTT AC TTT T C T G 
TCAAATTTGCA 

CTACTTTTAATTTGTGTGCAAATATTCTATTTTACTTGATTTTTATATACTTTTATTTTACAATACTTT 
TTTATAGGACT 

TTTTATATCTTTTCTTTATCAACTGTTCGCTATAGGGTAGGTCTTCCAAGCTAATTTTACCCGACACAA 



GATGAAATATT 

TTCTGTTGAGCACTCGTTGTCGACAGTGAAAAATTTTCACTCAAGAAAATATTTTATCATCACTTTTTC 
TAGAAGGGAGG 

TTCAAGTGTTGGAGAATAGACAGCGAACACCTGATATTCCCAAGGTCGAATTAGATTGAAAGATAAATA 
ATAGTCATATT 

TATTTTGTATTTAGTCAATAAATTATCTTTTTATATTTAAATTCTTAGTATTGTCATACCACGTAGATT 
GATACGGACAT 

ACTTAGCACATTTAACATATATTAAGCACCGATTACCTGTGACATTCCGGAGTTTACTGTTTCGCGCAC 
GCTGGCAGACG 

AACATCAACTCATCTTTTATACAATATATTCTTACGATTATAACTTTCAATTAAGAAATACAACTTCTT 
ATTAGCATTCT 

CCTACAAGTTCTTAAGTTCCTAGGAATTTCTTCGAAACTATAATTAAAGACGGAAAAGTGTAAAACAAA 
CAGAAAGCAGA 

GGAGGCCAAGAAGAAAGCAGAGGAGGCCGCCCCACAAAAGTTTGACAACTTTGACGACTTTATTGGCTT 
TGACATCAACG 

ACAATACCAACGACGAAGACATGTTGTCCAACATGGACTACGAGGACCTAAAATTGGACGACAAAGTAC 
CTGCCACCACA 

GACAACAACTTGGACATGAACAACATACTTGAAAACGACGAGCTGATACTAGACGGGTTGAACATGACA 
TTGCTCGACAA 

TGGCGACCACGTAAACGAAGAGTTTGATGTAGACAGCTTTTTAAACCAGTTTGGTAATTAGGGGCTCTG 
TTCTACAAGAC 

ATATACAGATAGTGCAGGAATAAGAAAAGAAATATTTTATATAGCTATATATTTCAAGTGTTTATTCTG 
TTCAACAAGTT 

CTAACCGTAGATACACCAAATCACCAAGTCAGACATTACTGAGCTAGCTTAACGGTCCAACTACTTTAA 
ATTGCAATCCG 

TTCTTTACTTGAGTCAGTCGACTCTACAACAACTATCCTGAGGTGATTATTTTTTGGTGGAAATTTTGA 
CCAAATTCTTA 

AGCAAAAATCTAGTTTCTACTGATAAATAAATACACATTGCTCTACTTCTGTACTCCACACTCTGCTAT 
TGCTTGATAGC 

CATCCTTAAATCAACAGAATCCACTAATTCTGCTACTTCCAGAACCATGACTACTCTACATTTTTAACC 
ATCTCAATTAA 

TTACCATCTTTTTCTCTCATTATTTGGCACTATGGCCGAGTTGGTCTAAGGCGGTAGACTCAAGAATTA 
TTCTTCTCCTG 

CGATCCAGGGGTTTCTACTATCGTAAGATGCAGGAGTTCGAATCTCCTTGGTGTCATTATTTTTTTTTT 
TCCAAGAACCT 

CTCATTTTTTTTTTTCAAAAATTATTTCTACAATTTCCTCTATTCTTAAAAATCTTTGGTATTAAACTA 
AAAATGTACCT 

AACTAAACT ACT AGGCTGGAAAATAATAAATCTAACGT TAACGAAAT AAGCAAAAGTAAT T T T T TTTT T 
TCAAGACAATT 

CCATGTTTGGGGATGAAAACTGCCTGCAATTATATATCCTGTAACAATCCCCTTATATCAACAACAACC 
CGAGAACAACA 

AAAAGTCCACTGGCAGAAACCTTACCACCAATATTCTCAATTTGTGTCACTGATTGGGCAGTTTGTGTC 
GATATCCATGA 

TGTGGTCAAACTGGCAGCAGTGGTAGATGGATAAACACTTTCAGCAGCAACAGTAACCGAGTTGACAAC ■ 
TTCCTTAGCAG 

CTTGTGTATCACACTCTTCATCATCATCCCAGCTATCATCCTCATCGTCACACTCTGGTTCAGGAGTTT 
GATCATCTTCA 

TCATCGTAGCCATCTTCACCAGGGCAAACATAATCGTTACCAGATCCACCCCACCAGCTTCCAGACGAT 
CCACCAGTAAC 

TGAAGAAGAACCGGAATCACCTGAACTAACACCAGAACTGGATCCAGAAGTAGTACCACCACTTGATCC 
AGCACCAGAAC 

CCCACCAAGAGCCTGTGCCAGATCCAGAACTTGATCCACCTGTTGGCACACATTCGCCATCATCTTCTT 
CATACCATTCC 

CATTCACCATCATCAGAGGAGCCACTGGCAGAACCACCGGCATTGTCTTCCCCTTCATAGCCATCATCT 
TCCCAGTCATC 

TGGATAGACAGTGTGTGTGGTAATAACAGTCACAGTCGTGGTATATAGCTGTCCACCTGGAGCAACAGT 
TGTCAGTGGAC 

ATGTGGTTGTGATTGTCAACGTAACAGTTTCATCACAGATTTCACCAGATTGTGTGAGATAAGTGGTAA 
ATGTCTGACCA 

CCACCAGTATATGTGATAGAAACAACTTCCGTTTCAGTATGTTGATTAGTGGTTGGAGGTAATTTTGTG 
GTGAGTGTTTG 

AGTTGTTGGCACCCCATCGGAAGTAAATGTTCTAGTGGTTGACACAGTTGGATGGATAGTAGGAATTTC 
AGTTTCACAAT 

CAGTCTCGTCATCGTCGTCATCAGAAGTGGTTGACTTTGTTGGGAGAACAGTAATAGATCCTGACCCAG 
TTGGAATAATA 

GTTGGAAGAACAGACGTTGTTGGAAGAACTGACCCACTTGGAATGATGGTTGGAACGTCTGTCTCACAA 




TCAGTCTCAAT ' 

TATCTTCTGTAGTGGCTTTTTGAAACAACTGACGAGACACTTGTCTTACTTTGACTGGTGATTGGAAGG 
GTTGGAATTGT 

AGGACCAAAATTTGGGGCTTCCATTGGATCTTTACACTCTCCACCACTGCACAACTTTAATTTGGAACC 
ACAACTGGAAC 

TAGTTTCTGTTTCAAGGCTTTACCAGTTGACCTGATCGTAATAAGCCACGGGGTTACCAACTTGTTGCA 
TCTTCACTGAT 

CAGCCATCAATCTTTGATAAGCCCTGATTTCTCTCATCTATGCAACAATCTTCTATTGTGAATCATTTG 
TTTTGCTAAAC 

TTGTAGTTGGTGTCCAAAAAAAAAAGTGATGTAAAATTTAAATTTTTCTGAACTTGTCGTGTAAAAAAG 
TCTCCAGAAAA 

AGGGACAACACACACACCAATTTTTCACCATACCACACAATTCACCAATAAGCTCTCTCATATCCATCN 
AATAATTACAG 

TACAGCCTCCTATTCNCAATTTTTGGNATTTAAACCAGTTCCCTTGGCAGGTCACCAGTTCAT 
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>retrotransposon_26 770bp POL protein: 2-322, LTR san: 390-377 

TGATTTGAGAAATACCATTGAAGATCTAGAGTTAAAAATAAGGAATTTGCATGTACATGAGGATAATCA 
AGCGGTCATTA 

CAATCTTAAAGAATGATAATTTCCACCCACATAGACCGATTGATATATGTTACAAATTTCTCAGACAAA 
AATTGAAAGAT 

GGATTTTTTTCAATATCATATGTTGAATCTGGAGATAATTTAGCTGACTCATTCACGAAAGCTTTAGGA 
AGAAATAAATT 

GATTGAACATACCAAAAGGATTAGAGAAAGAAAGGATTATGATAATAATGCTACACTGATAGTGGACGT 
TAGGACGCTCG 

AAGAGATTAAGATAAACAAGAAATTGGTACATCATTAATTAATTTAGCTGTTTACCTGAATCAGGGGAG 
TGTTCGCTATA 

GGGTAGGTCTTCCAAGCTAATTTTACCCGACACAAGATGAAATATTTTCTGTTGAGCACTCGTTGTCGA 
CAGTGAAAAAT 

TTTCACTCAAGAAAATATTTTATCATCACTTTTTCTAGAATGGAGGTTCAJ^GTGTTGGAGAATAGACAG 
CGAACACCTGA 

TATTCCCAAGGTCGAATTAGATTGAAAGATAAATAATAGTCATATTTATTTTGTATTTAGTCAATAAAT 
TATCTTTTTAT 

ATTTAAATTCTTAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCACATTTAACATATATT 
AAGCACCGATT 

ACCTGTGACATTCCGGAGTTTACTGTTTCGCGCACGCTGGCAGACGAACA 
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>retrotransposon_26 POL protein 106aa 

DLRNTIEDLELKIRNLHVHEDNQAVITILKNDNFHPHRPIDICYKFLRQKLKDGFFSISYVESGDNLAD 
S 

FTKALGRNKLIEHTKRIRERKDYDNNATSIVDVRTL 
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>retrotransposon_27 598bp LTR san: 143-523 

CTTCAATGCTTCACTTGTACTAGTACCCATGATTGTATAGTGGTGTGGTTGATCGACTTCAATATAACA 
AGAGAGAGATG 

AGATGAGATGCTTTTATCGCGTATATATTTTTTTTTCCATTGACAATTCTGATTTCACAAATTGTTCGC 
TATAGGGTAGG 

TCTTCCAAGCTAATTTTACCCGACACAAGATGAAATATTTTCTGTTGAGCACTCGTTGTCGACAGTGAA 
AAATTTTCACT 

CAAGAAAATATTTTATCATCACTTTTTCTAGAATGGAGGTTCAAGTGTTGGAGAATAGACAGCGAACAC 
CTGATATTCCC 

AAGGTCGAATTAGATTGAAAGATAAATAATAGTCATATTTATTTTGTATTTAGTCAATAAATTATCTTT 
TTATATTTAAA 

TTCTTAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCACATTTAACATATATTAAGCACC 
GATTACCTGTG 



ACATTCCGGAGTTTACTGTTTCGCGCACGCTGGCAGACGAACAGATTAGAAGCTTGGTAAATCTTTGGT 
TATTCATCACG 

TCTTGAGAATAATACAAAGTTTAATATAGTATTTTCAA 
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>retrotransposon_28 1082bp LTR san: 558-939- 

ATAACCACAATAATCGGCCTCGTAAACGTCGTCAGTGGCTCAAACACATTGCTGCACCTTGAGCTCTAG 
AACAACCCCAC 

ACTCACTAGCCATCGCCACACCAACAACCAAATTGCTGATCCAGAAAAAATACCACCCCCGTAGTCCGG 
CTTGTATGGAA 

TAATTGCTTGGCCAGGTACGTCCCCACCTCATCGTGTCTTTTCTGGTTGAAATATGTCATCTCCCGGGC 
TAACAGTACCG 

TATCTCTGTGGCTGGGGCATCTATACTCTTTCATTCTCGGCTTACAAATCTATCTTGTTCACACATTTC 
ATATATCTGGG 

ACTTGTCGAACTCTCTGCACTCTATCATAAACTGGAACTCGCTTGCATTCTGGGACACACACTGGAGCT 
GGAATCCATGG 

TCAGGAAATGTGAAAATTTTCTTCTCGGGAAATATTTGTGACAATTAGTCCTAGTACACGATAGTTTCA 
TTACGCCCACT 

AAAAGTGTCTACTGAAACTCGGTCTCTATATCGTCAATATCTTTCATTTCTCTTCCTGGCTTTTCACTG 
CGACTTATTGT 

TCGCTATAGGGTAGGTCTTCCAAGCTAATTTTACCCGACACAAGATGAAATATTTTCTGTTGAGCACTC 
GTTGTCGACAG 

TGAAAAATTTTCACTCAAGAAAATATTTTCATCATCACTTTTTCTAGAAAGGAGGTTCAAGTGTTGGAG 
AATAGACAGCG 

AACACCTGATATTCCCAAGGTCGAATTAGATTGAAAGATAAATAATAGTCATATTTATTTTGTATTTAG 
TCAATAAATTA 

TCTTTTTATATTTAAATTCTTAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCACATTTA 
ACATATATTAA 

GCACCGATTACCTGTGACATTCCGAAGTTTACTGTTTCGCGCACGCTGGCAGACGAACACTTATCAAGG 
TGCTACTCCCG 

CGCATCAGTTTCCTCTGGGTTCTCTTTTTGATCTTGGTGAACTACCTTTTTTTCCCACTCGCGTGAGAA 
GTTCAACACTT 

TTTTTTACCCATCCACCAAACTTTATTCTTTTCCCCACCATG 
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FIG. 1. Plant, Ewan P. 
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Table 1 Transformed colonies per ^ig DNA 





S. cerevisiae 


C. maltosa 


C. albicans 


pRPU3 


5000 


8600 


6500 


pRC2312 


1600 


6500 


400 



Table 1. Plant, Ewan P. 
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Retrotransposition in H1051R Retrotransposition in H963R 




genomic DNA LTR gag/pol ura3 LTR genomic DNA 

probe 
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H963RU INSERTION SITE DATA 



IIRA3+ DERIVATIVES OF H963R 



STRAIN 
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iDtegratioQ of pRUU bto bOGlOSl Iitf egration of pRUIA fato faOG963 

hOGlOSI HIOSIR hOG963 H963R 




probe 
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U>UOin<AXXY FIL 




29/10/99 09:53 BALDWIN SHELSTON U(=lTERS CHCH 



'1 



NO. 048 P025 



1 



contig4-2780 (H963RD6) 
Tca2 insertion 

r 



I I I 1 I 1 

8100 8200 $300 6400 d$00 8600 8700 8900 9000 9100 9200 9300 9400 9$00 9600 9700 98009900 1000(1010(1020(103 



contig4-2777 (H963RU8) 




ittm^^S m* F '"Ln.f'^ II ^ l i i r iwiL liiiiiiii f i ' calekim-aansBoiiing Al 
5400 57006000 63006600 6900 7200 7500 7800 81008400 8700 90O0 9300 9600 9900 102011 050*1 050n 1 10ft 140(1 170i12000 



1 



contig4-2296 (H963RU10) 

Tca2 insertion 

n k n own 



32OQ3OO4OO5Ol36O07O(38OQ9O»4OO(4lO42O43O^'tO46O«l6Ov47Qu^8O**9O(5OO61Ot52O«3O<^ 



•1 



contig4-3108 (H963RU18) 

Tca2 insertion 
tge-stran d-brepk repair prot, 

78807d00792079407960798080008020&04080608080t8t0081208l408ie091808200«220S24Qa2608280830083208340836 



could tte pair of ui 



Tca2 Insertion 



contig4-2882 {H963RU30) 




nucleolaf pfot (N0P4) 



i 



5600 5800 6000 6200 6400 6600 6800 7000 7200 7400 7600 7800 8000 8200 8400 8600 8800 9000 9200 



-i 



contig4-2025 (H963RU43) 



Tca2 insertion 



i 



i ( j i ] t i i 

1300 1400 1500 1600 1700 1800 1900 2000 2100 2200 2300 2400 2500 2600 2700 2800 2900 3000 3100 3200 330 



i 



i 



contig4-2991 (H963RU3) 

Tca2^ insertion 



negative regulator of transcrtotion f NQT4) 



18200 18400 18600 18800 19000 19200 19400 19600 19800 20000 20200 20400 




29/10/99 09:53 BALDWIN SHELSTDN UATERS CHCH 4 



NO. 048 P026 



contig4-2386 (H963RU46) 

Tca2 insertion 



unknown 



I i t ( I r 
420C430C440l>;50C4eOC470C460C490C500G510<520C530C540C5SOC560C570C580C59^^ 



contig4-2668 (H963RU50) 
Tca2 insenion 



L 



unknown 



610620t630640e50e60670(680690C700f7'lOiraOC730(740f750t760f770(78Q<790eoOC81^^ 



Tca2 insertion 
atjyejnethynransferase 



contig4.310S (H963RU52) 




MSS51 

581 (X5»2QC583O©B40C58S0(58e0(5870C5880(5a90600O(S91 0(392(X5930(5940C5950(S960C5970(5980(5990CBOO(K601 0 



contig4-2396 (S963Ra53) 
Tca2 insertion 



incompiete TcaS -4-) 
^^^^ partial refro^nsposon pol _ probable membrane prot , 

■BMiWWWM|iiiiiiiiiiMiiyMiiiiifiiiyi|||iiM^ i i ^BKKtKKKKKtKtttl^ 

200 400 600 800 1000 12001 400 1600 18002000 220024002 600 2 8003000 32003400 360038004000 42004400460 



contig4-2824 (H963RU59) 
Tca2 insertion 

_NgR3-like protein pr qbabl» membrj ^ot. unknown 

200 400 600 800 1000 1200140016001800 2000 2200 2400 26002800 30003200 3400 36003800 4000420 



contig4^072 (H963RU63) 
Tca2 insertion 



unknown 



jl 



unknown 



I I \ \ T\ 

23200 23400 23600 23800 2^000 24200 24400 24600 24800 25000 25200 25400 26600 25800 26000 26200 2640 



Tca2 insertion 
sn r\aa nud gar ribonucJftoproi^i^ 



contig4-2294 (H963RU65) 

unknown 



T I t 



300 600 900 1200 1500 1800 2100 2400 2700 3000 3300 3600 3900 4200 4500 4800 5100 5400 5700 




FIGURE 68 
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FIGURE 69 



insertion site 

Contig4-2991 TATATATGTT AATATACACT 

contig4-2780 GAGTCTGTAA GAAATCACCA 

contig4-2777 GCCACTTTGG AGTACATTCG 

contig4-2296 TATTCGGTTT TAAATAAATT 

contig4-3108c AAAAAATAGA GAACGCGCTG 

contig4-2882c TCTTTCTTTT TCTTGACACT 

Contig4 -2025c TTCTATTTTT GGTTTTCTTG 

contig4-2386 GTATAACAAC ATTTGTAACA 

Contig4-2668 GCCTCCTTTG GATTTCTATA 

contig4-3105c ATTGTTCATT AATTTCTTAA 

contig4-23 96c CTGGAGCTAA AAATAATACA 

contig4-2824 ATACTAAATT ATAATATAAA 

contig4-3 072 AATAGAGAAG AAAAAAAATA 

contig4-22 94 TTGTGTATCG TATACCATCG 



FIGURE 70 , / . / < y^S 



genomic DNA LTR 



gag/pol ura3 LTR genomic DNA 



\ 



pairing ofLTRs 




recombination between LTRs 



LTR 



FIGURE 70 




FIGURE 71 ^ 



>retrotransposon_01 994bp Incyte: 1..994; kappa LTR- 548 827 
TAGATATTTATATATGTATATGATTAGACCAACATAAAACTAGACGTCC^^^ 
TTGATATATATTCTTATTTATTACTGTTATGATCTTTTGATTCACACAGAGATT™ 



CTTTTGTTTTGTAGAAATCTTTTGCTTCTTCAATTTGTATTTTCAATTC^^^^ 

GAGTTGGAATCACACCTGTGATAAGAGC 

agtagctttagtcattcttatagttag; 

GACOriTGTGTa«KMATMCACC™ATATMGTCOT<KGTATTAGGTC«AcI?^^^ 



TSAAGGGTAGTTGTGTTAATTGMGATil«:TGGAAAACTaTACTTITCCTTO™?S??S 



.T 



ACTTGT 
TCAATCT 



GGCAAGTATGGCAATATTTCATCGTGTATTTTAGCTGGAGTTGGAATCACACCTGTGATAAGAGCAAAA- 

:tgtttcagtagctttagt 
:tggaaaactatacttttc 
:ttcttggttcttagtatt 
?ataagtcgtgcgtattag 
^gaagagaaaagaaaga 
jggcgtaaacttcattcac 

^!!^!^^?™^°^°'^^^T^««ACTAATTCTCACGAATATTC^^^ 



GCACTCATCGAGAGCCAGGAATTAGTATAAAAAGAAGAGAAAAGAAAGATATTTAGGATATTTATTATAT 



TATGGTGCGGAACTTTATTTGTCTGAACCAAAATCAAAGTCACATCAl 



\TTTAAATGAACGTTGACATAAAT 

>retrotransposon_02 1348bp Incyte: 1..1348; kappa LTR: 764.. 1043 POL 
(contains stop codons) : <136 714 o-i-.^u^J, POL 

TGTATGGTACATGTACGACAGCCCAAAAAATGGTATCATTTAGAACTGTATTGGAGAACATTAGTTTTO^ 
^f^^J'^^^^^^^^^^^^^^^^^^^^^^CGTATTATAGTA^^ 

IS™™ 

AGAGTTTATTTCGCGTCAAAATCAATTTAGGTCTCATGACAGAATATGTGAGATAAAATGTCCACGTAAP 

caaaactgggtgatactttgaattaagagatactcctaaataagcaaaccaaggJ^^ 

TTCGTATGGTAAAACGTGCTTTGAGTTCCAAATGATAGATGCGAGATACCAACAA^^ 

AATGCTGAAGACAATTTCACTGAGGTTCGAAATGAAAAATTACTTAATTCAATTA^ 

AAGGTGGTCTGGAAGTGCTGATATGAACACGAAATTTAATGCATTCTGTGGAAA^^ 

JJ^^^^f^^''™^^^^^^^^^^™^^«^^^^TTGTGTTGTGA^^^ 

AAGTTCAAGACATTTATTGATGGTATATTCAAAGGACTCGATGTTGAGAATGATAA^^ 

™^f°''''^^^^°^°^^^°°°^^^C^^CTTGATAT^^^^ 

AAATTTGCACTCATCGAGAGCCAGGAATTAGTATAAAAAGAAGAGAAAAGAAAG^^^^ 

TTATATAGGGACCGAGTTTCAGGAGACACTTTTAGTGGGCGTAAACTTCATTCA^^^^ 

™°^^^^^^°^°^^^^^^TC°TCTCAGTTTTTTG^^^ 

TTTTGTCAGCTTGATTGAATGGAAGAGTTTACTAAAGTACCAGAAAGGTGTTTT^^^^ 
IJ^J^'^^^^^^^^^^^^^^^^CTTC'^^GAAACTGTACG^^ 

LSHs'ssr'-^' 1.. 85/2131.. 3034, Incyte: 86.. 2130; kappa 

TGGTTGGTCTTATCAGTAGAGGAGTGAGTATCAGTTGCTG 

rGATATAAGTCGTGCGT 



TAGGATATTTATTATATAGAGACCGAGTTTCAATAGACACTTTTAGTGGGCGTAAAC^^ 

aacaaaattttcgaaactagtcaatcacaacaaatttgtttgagttcaactgaaacgatS^^ 



„ J 

aacaacaacaacaacaacaacaacaactgttcaatgcaataataagagagI^Ic^^^^ 



[■gat; 



TTAQTATATGTATCMTGGTMAMCTATTTlTTCTATTmTTTTGGTTTCTAAArrTTGA 
™r!?3^n^!=J?»!??^™^^"^"'^<^"CSACAACAATT^IS?^S^^^ 



TCaATTTTTC^TTSTATTAiCTMATTrrSCATITACOTrrWAAl^TTTT^nScSI^^ 



TCTAGTTTTTC 
AAGTAGACTTT 

GTCTTCTTTGTTTTGGTATTGTCTATGT^^^^^^ 



.TGGGGTGGCGGAGTTGGGTGCAACGCAAACAAAAATATTTTTT 
[■GGAAATTAGTTCCATTATGATAGCATTT 
-TTCTTTCTCCTCCGGTGTCAATCAATCC 



^^?^?IJf'''''™="=*^"''™^='^™«*"«=MTCAATTATS^J^^ 

^™S™"^2?f=!-°*==°»-=-=-^==0TTTAA^^^ 

ITTCCTAAAAGATGTCCTTTACGGTGGGCCCG 

rn 

GACGTATTCTTTACAATTTCATCAAACCAGTTGTTGT 



^TCACAAAAAAAAAAGTGGTGTACAGAAAACGTATGTATGT 
AOK^OAAaOACA^TTTATC^CA^A'^JSr^^^^^ 
OaeAACCC«ArrTTCAGAAArrTCA<:CTGTTTGa3<K:GCATAAT<3TTCACAACCCAaaGTO^^ 

TCTTGTTCACCATTGTTTAGTTTTGTTTGTGATGAATCT 



GTACCAACTAAAATTAGGTGTTAGTCTGAAT' 
CAAGATACAGATTGGTTTTACAATAATACGTTTGTTi 



CCACAAAAACATATTCTGTATAATCTATGTAATAT 
ACTGTAGTAATGCCTAATCTAATTACTAAATAGAAA- 



GTTGCTGTATGAACAGGCAGTCACCCTTCCTCCC 
TATAAGATCCAATCAAAACATCACCACCAAATAAT 



A' 



TTCGGTAGAATCCGAAAGACTAATGAAGAAAAAA-I 



GGTCCAATTTGrraa a az^z^AT^n...... -TATAGAATGGGGTATGGTTGAGATTTTTGGGTAA 

GGTCCAATTTGCCAAAAAAAAAAAAATATGCAACCTTTTTCCCTCCTCCACCTCCTTCCTATTTCGTGAA 
GGCAAATATGTAAGTAAGTTCGAT — TCAAGAAAAAAGGTTAAGGTCATTGATCAATTGAT 
>retrotransposon 04 3504bp public- l 46s/0Rai ,rn^ x 

Tcal-like LTR: 6i8..1075 1 •■ 466/2581 .. 3504 , Incyte : 467.. 2580; 

TTTTCTCTTCTAGCTTGCAATTTTTGTTGACGTTTACTAGTAGCAGAATTGGTTTGTTTAGTTTCTC 

TATTCTTTTI 

GTAAATAGCAAATCCAGGAATTATCAAGTACCCATACCATACTTTATTAC^^^ 



GT^CTGGTGTAGAGCCATT^™ 

rcc 

[•AG 



rOCTT 
FACTCAATTT 

iACCCATACCATACTTTATTACTTCCAAAAATi 

:atcaaaataatattcatataaactccccagt; 
\ttggtatatttgggacgaccaaatttttcca; 
^tccacggtttataggaagatggacgatggaa/ 
:ggaaatgattaataattgatttaatatgttgg 
:attgttaatattgttaaattgggtaaatagm 
:aattattatcatcacctgcggaggttagtca;^ 

oaga..cc„aa™aa;SS=™a:^-?S^^^^ 



^^™^!!f^i?5r^?'°*=™'^<^^'''^''™™3ACGACCAAATTTTTC^ 

aatggagata 
gtattggcta 
?vtgaaggaag 
zvtttgagatt 

rCGCTATAGA 
jGTGCGTGGT 

GTACGACGGTCACAAAGATTGCGGCTTATGi= "-^^"-----^^^^ ^-^-^GTGGTT 



^TAI 



GAGTTTCTTTTTTTTAGAAGAGGTTGATAAGCCAACAGATGAGGAGTAACAAGTAACTCGCAACATTGTA 



aaaaacgagcttaatgagtagacggtctgttcatatgaaacaattgaaagggttgS^^^^^^^^^^ 
attatataattcatgtcaaactgggaggcttaaattatggtca™ 



TGAATATTGTTTGGAAA 



CAATTCTTGGACCTGGAAATCCCACAAGAGAGCGTTAGTTAGTTTGCACTCTCCTCACCAGTT^^ 



TGGTTTACTGGAGTCTGCATTCCCCACAAAAGTACCTTTCAAAACTAATTAATGTAGCTTCTATTTGATA 
GCCTCTGTTATGGAAATAGATTTGCTCTGCCCAGTGGGTGTAAT^^^^ 

GATATGTTTTAATGTCAATTTAAATCTTGTAATAATAGTAAGGATGCGGTTTATCC^^^^ 



A 



CACCT 



ACCTGTGGAGTTACTCCAGAACAGAGGTTCAATTTTTTCTTGGTTGGTAAATTATCCGAGTAACACGGGG 
TAGCTTGGTTACTCCAGTTGAGAATGTAAACTATAGATGAAGATTTCAACACGC; 

AAGCGTTATTTTGATGGAACGATAATTAACGATGGTTCTGCACAAAAATGTGGTCCAAAG™ 



TGCTCTCATGACCAGTGGCAAATTCTTGGTAACGAGGCTTAACATTAATCCGCAAATTACCTGGCAACAr 
AGAAAACACCCAGAAAGTTCTGTCGTATGAGAAAACCTACAGTTGTTTC^^^^ 

ATAAAGAGACCAGTAATGCTAAAAAAATTTTTATTTCTGCATTACTGTTTTTAGC^^ 
TTATTGTATTTGTTAAACATTCTTTTCCTGAAATTTTAAGAAAATGTTTTGGT?^?^^^ 



CTACAATATGTJ 



TCACTATATCGTGTAACAAGAAATTTCTATACCAAATAAACAGCACTTGATTGAACTACAATATGTAAAA 
ACTTGCTTTTATTACCAGTCTTCATACATACCCCGGTCTTCTCTT^^ 



TTAC 



CAGTTATCTTTTGCAACTTTTCGCGAGCAATGACAAAAGTTTGGGGCGTGAGGCAACAAAATGCATGGPA 

AGACTTTTTTGATCATGAATTTTTTTTGCCATGAAGGTGCTTTCATTGTTC^^^ 
AAAATTTGTAGAGTCACAATCAAATGACTTGATAATTTGATAG^^ 

tcataccaatgtatgcataaccataaagaacttactaattatgcacctgcaatcagaSg^ 
cgatgatttgccaaatgaccgtaaaacgactagcaaaaacagtgacattttttSg^^ 

AAAACCATTCTGGTTTGTTTCGTCATTTACACAAATATTCGACACAAAAACT^^^ 

aaaaaatgtgcaggaagtcttggaaccgatacaaaaatttttacaaaccacgtac^^^ 
aagaattagtcggggaagaaggcccagaaacttgagtaaagagtggattcaacaSS^^^ 

CAACG 



TTCAAACGTCTTATCAATTTTTCTCTTCACTACTTTTCCAACTT^^^ 



>retrotransposon_05 3955bp Incyte: 1..3955; Tcal-like ltr ■ 9fic:« loz,. 



AAAAACTCAACTTTCTTTCGAAAATCAAGGATCAATGTTGGTATTTATATACTTTTTTTTTTAGTCAAAC 

GGGTTAGAAAACAGGAAACAGCAATAGAGAGCAATAATTGAAAAATAGTGTTGTCAA^^ 
TGGTCAAACTTTAAATGCAAAACATGAAATTCCCAATTTCCAGAATAAATAATATC^^^ 
CGAAAACTACTTTACCGTGTCGCTTTAACCCCCCCCTTCCTAAAACGAGACAATT^^^^ 



cgaaaactactttaccgtgtcgctttaaccccccccttcctaaaacgI^;^;^^^^^ 

AATTATCATAATCCCCTTTTTTTTCCTTACAAAACACTTTATTTTTGTCGTTTTCG^^^^ 



agaaacgacaattgattacacctcgatatgcatacgcatggcaaagagaataccgagttaat' 

ATGACTAAAATCATAGCTCTAATTTTCAGTTTACCTTTGTTTATTACGATACTGCCACAGT^^^ 



'AGTGAGTC 



[■CGAGA 
3TGAAA 



AAAAGTGAAATTATAATTGCTGCTGACAACACCAACAATACATACAAAT^^^^ 

ttttctatggcaccaaaaccaaagcctcaattttaatttactctgtgtggtacaaaatacattag; 



^.^^^''''^^^'''^^^''^^^^^^^^"CTATCTGTTCAATTTCTTGTATAAAATAAAGCAATATGAGAGA 



^CCCCGTGC 

TGAGGAAGAAATTAAGCGATATCGGTTTATGATGTGTTTAGT^TT^^^ 



CACAATGGCTCAACAACAGCCAACACGGATCACACATTAAATTTTTTTTTCGTGCAGGACCCCGTGGTGG 



ACGTATACAAAACTGGTGGTGCTTGAAACGAATGAGTAATACAGATCTAATTAAGCTGTGATTTTCTAAG 
TTTGCCTTGTCTCTACAGTTCAAAAAAAAAGAACAGAACACCTCAGAGGCTGTTGTGATGCAATTTTTA^ 

AAACGGGGAATTGAACCCCGGGCCTCCTCGAATTTTGTGTTTGGTGAACAACCCAAACGAGGAATCATAC 

TATTACAGATAGTCATGTTTGCATGGATGAATTAGTACTACTAATAATATAAGAAAACT^^^^ 

GTCAATGTCTTATACATGTCTTCTGATGGGTTATGCATTGATTAATTATGAATTTCTTTTAAATACAATC 

TATTGCTATTATTTGTATGTAAAACTTTACCCAAAAACCAACAAAAAAGAGTGGTCTTGGATAAAGATTA 

AAGTAATTCCAAAAAGATTTGGTAATTAGCTATATTGTTTTGACGTACATCTATAACTACAAATAGCCAT 

TCAGTTTGATTATGTATATTGACATAGTTGGATTTGTAATTTCTGTTAAAATGGAAAACCCTAATCAAAT 

GTATATGTTGAATAGGTAGTTAAATTGTACAACCTACTACTTGTTGTCAATTGAATTCAGAGCCAATACT 

TATATCTCCTGGAAACTGATACACAAACGAATTGTTAAACTATAACACTCGACGTTCACATCTAAGGATT 

CATCGTCGTTAAGATTTATACTCATTAGCAAACTCACTTGCCATATTAAACACTTCTCAATCTATTTCCC 

CATGGCGTATCCCACAAAAAACCGTCAAGACAACACCAATATGACAATGCCAATTATACAATTGCATATA 

CCACGTGACTTCATTTTATGGTCATGAGAAATTAACTTATCATGGGGTTAGGCGAGAATATCAACTGTTC 

GCTATAGAGAGATTTCCTAGCCGGAATGCACGACAATCCTGAGACGGAAGTCGATCGACGATGCCCATGG 

TGCGTGGTGAAAAATTTTCTTAGAAAATTTGTTCTTTCCTTCAACTGCTTTGAAGAAAGGGAGGTTCAAG 

TGGTTTAAGTACGACGGTCACAAAGATTGCGGCTTATGAGGCCCGAACTGAGTTGAAATACAAAATCAAG 

ATATAATTATATACCTTACTTGTCTATATTGTTTTATAATACATTCTTCAGATATTTAAATTTCTGTGTA 

TCATTCTATAAAACAGAGATACATTCAGTACATTTAGTATACTGAGTGAACTGGTACCTGTGACATTCAA 

GATAACTGTTTCGCGCACGCTGGCAGACGAACATCAACACTGATCATTTGTTTTTTTTTTATTTCTCCTT 

TTTCTCCTTTTTCTTTCTTTTTTCTTCTTTCTTCAGACGTTGTTGATTTATTTTATCGACAGCATCCTTT 

TCTTTGGCCACATATCCAAGCGATATACTGGCCAAAGCGAAGTCCTTTTATAAAGCAATGCTACCAAATG 

TAACAGTTCGAGGTCAGAAGATTAAGCGGGTATGTTCACACGGATATTTTATGGGGTATCACTTGTACCA 

AACACTTTGATACGATAAGAATATTTGTAATACTAACTTCAGTGTCTTTCATAATCAGCTCATAACCTGT 

TGGAATTTAAATTCGTATGTTGTTCATTCAAAATTTTGATAAATGGGACGAGAAATCATCGTTGCCTCCT 

AATTAGATTATGACTTAGTACTAACTAAACTGTTTATCATTTTTTAAAGCGTTGGGCTCCATGTTAGAAT 

AGATTATTAGGGCGGTACGTATTTCATAATTTATATATAGGTACTTATTTTTACTAATTTATTGCACAGG 

AAAAGATAAAAGGTATCGATTATACCTATCAGCAAGGTTTAAGCAAAATGAAGTATTTTTACCATATTTT 

TCCATTTTTATATAGATACATCAAGAGGTTTATTTTAAGTTCACCTGGATAAACCATTCAACTAACCCAA 

TTGAATTGAATGACAATTTGATCTCCAAAGAGGGATTCATTTCTATTCTGGAGAGATAAACGTCATTGTT 

TAGGAAAGAGCAAGAGATAAGAAATCTTTTGTATATTGTATATATATTATTAATGTTATATTACACTATT 

GTTTGTTTGTTTGTTATAATTATATGTGAGATTTCATATGTAAGATGTTGTTATCTCTTTCCATTATTTA 
GCTTTTTTGAAAAAGCTATCAATGGCTCCACGTTT ^CATTATTTA 

>retrotransposon_06 1434bp public: 1..1434; Tcal-like LTR- 87 475 

TAGATGCAATAGGTGTATGAAATGTATCTAGATTATATCATGAAGCCCTTGCAATAAAATCTAGCCAAAA 

ATTTGTGTACTGCAATTGTTCGCTATAGAGAGATATCCTAGCCGGAATGCACGACAATCCTGAGACGGAA 

GTCGATCGTCGATGCCCATGGTGCGTGGTGAAAAATTTTCTTAGAAAATTTGTTCTTTCCTTCAACTGCT 

TTTAAGAGAAGGGAGGTTCAAGTGGTTTAAGTACGACGGTCACAAAGATTGCGGCTTATGAGGCCCGAAC 

TGAGTTGAAATACAAAATCAAGATATAATTATATACCTTACTTGTCTATATTGTTTTATAATACATTCTT 

CAGATATTTAAATTTCTGTGTATCATCCTATAAAACAGAGATACATTCAGTACATTTAGTATACTGAGTG 

AACTGGTACCTGTGACATTCAAGATAACTGTTTCGCGCACGCTGGCAGACGAACAGCAATTCTGTAATTG 

TCGTAGAGTAGCAACAAATCTTCCCGATGATTGGTACTTGTGTTAGTCTACACGACATGTGTTTTGGTAC 

ACTTGAACTGTATGTCCAAGAATGGAAACATATGCGGGAAGGACGCGAAAGATGAGTTTGGTATAGAAGG 

GATAAGAACTGTAAAATATATTATGTAGTTATATATTTTAATTATGGGAAATTGAGTGTTTATTCTGTTC 

AACAAGTTTCAACCGTAGAGATTACATTTAAAGTCTGTGGTCGAAATCCACAAGATACAGCAAATTCATG 

AATTCACCTATTTAAATCAAGTTTACCAAGCACCATTGCCTAGAACTTGCCATATCATCAATTAAGTCAG 

ACATTACTAATTTGAGCAAAGCTTTTAGCTTAATGGGCCAACTAATTTAAGTCGAATTGGTAATGCAATC 

TGTTCTTCATTTGAGTCGCTTGCTACGGCTCCATGACACATCCATTTGATTGTTTTAATTCGAGCAATTA 

TCCACCATAACTCTCAGTAATATCATTAACAGTTTTACGCTTAATAAGCATAGAAAGTTG^^^ 

TCTCCTAGGTATGCTAGAGAGATTTGTATATACGACCAGTAAAGAGTGTGATGAGGTGTTTACT^^^ 

taaattgcaattgacttgagttgatagcggttattacaaaagtatagattcaacaaattJ^^^ 

CAAACGATAGGCCGAATGTGACTTATACCGTTGAAGTTCAAGCGTTTTTAACAAATAGAAATGTGAGATT 



AATGAGTTCGACAAATGTTTTACTAGATACTATTAATTTCGATGTACTATATAAGTTTAACCAGCTATAA 

CCGGCAGAGCAGACTTCCTGAAACTCAAATTGGTTGTGTTTGGACTTGAGTTACACCACAAAGTTTGACA 
ATCGTGAGGACATAGCAACCTATCAAGCCACTCA 

>retrotransposon_07 1608bp Incyte: 1..1030, public: 1031.. 1608; Tcal-like 
LTR: 1048.. 1435 

TGCTAGTATGTATTTTGGCTCTTTGATCCTGAATGCGACAATGCAATACAAATAGTAGAAATAATGATGG 

TGATACTACTAGTATTAATAATAATCCGAGAAACGATATCACAAAATAAATCAGTGCCCAATGAGGTTGA 

TGCACAAATATTAGTGGTGTGTAAAACTAAAGAGAATATCTCGCTATGATTTCTATTGATAAGAAAAGAT 

GAGAGATTAAGGAAATATCTTCTGTAAAGTTGTATCGCCACCTTTTTTTTTTGTAGTAGTAGTATCGGTT 

TTGGTTTTGGTTTTCTCATTAGTTAAGATTCTTGCGATAAGGCACGACCTTGATCATTTGCATGTTTCTC 

GTTTAATTGTTTTTATTTCTTTTTTTTTTATGGTGTGTGGTAGTAGTTACAGATATCGACGGTTGCAAGT 

GCACGAGTGCTGCGACTGACCGGATCGTCATGCTAAAAGATTCAGGGGTGTGTAAGAGCGTGCCAAGTCG 

AGGAGGAACCAACATTTCACAACTGCTTCAGGATAGGGCATTCTTTTTCTTCTTTCTATTTGATCTAGCC 

TTGCGTCTATTCGTGTTGTTGGTTGGTACAAGCGAATATCCCAATAAGGTTTTTGTTGCCTATGTGCATC 

GTGTTGTAGCATAGTAACGAGAGATACGATTCTTCTTCTTCTCCTTCCCCTTTTCTTTGGATTGCTTTAT 

ATTTATATATATATATTGTCATCATCGTCACGAAATTCACTATCATTATCAATTATTTTGTTTTTTCTCT 

ATCTTTGTCCTCCTCGTTTAATCCTTATCACAGTTTTGGGTTGTTGCAATTTCTTTTCATTCTCCAGTTG 

AGGCTTACACTTTCTCTTGGAGTTTCCGTTTATAATTTTTACACACACAAAAGCACAAACTACACTTTGT 

CTTCACAGTGTATAACAGATACCACAGTATTACTAAGGGGGAAAACTAACCTAACCAAAGGGACTGACAA 

AATAAGTGGAAAGACTACAAATGACGCCCTTAATATACGAGAGAGAATTGAAAAGACATACACATAATGT 

TCGCTATAGAGAGATTTCCTAGCCGGAATGCACGACAATCCTGAGACGGAAGTCGATCGTCGATGCCCAT 

GGTGCGTGGTGAAAAATTTTCTTAGAAAATTTGTTCTTTCCTTCAACTGCTTTTAAGAAAGGGAGGTTCA 

AGTGGTTTAAGTACGACGGTCACAAAGATTGCGGCTTATGAGGCCCGAACTGAGTTGAAATACAAAATCA 

AGATATAATTATATACCTTACTTGTCCATATTGTTTTATAATACATTCTTCAGATATTTAAATTTCTGTG 

TATCAACCTATAAAACAGAGATACATTCAGTGCATTTAGTATACTGAGTGAACTGGTACCTGTGACATTC 

AAGATAACTGTTTCGCGCACGCTGGCAGACGAACAATTGCGGCGAAAAAAAAAAGAGGTCGCCAAAACTA 

AACTGTTGGGACGATTTGCTGCCAATCACAATGAAAAAAAAAAAGAACAGTTGGTTTGAAACTTCTTCCT 

CTAATACAGAATTAACTGATCTTTCTATCACTGTTTAAACTATTCATTACTCTCAAGAACTTACCATG 

>retrotransposon__08 1385bp Incyte: 1..1385; Tca2-like LTR: 49 328 

AATAAGTGGATTTATCATTACTATTATCGTAATGCTCAATCAGGGGAGTGTTGGTTTGTGCACTATTTTG 

TGTCAGAAACTGATCAATGAAAATGATGGTTATTATGAGAATGGAAAATTTTTCCATCACACATCAGGTG 

ATGACAGAACTAAACTATATTGTGTAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATCAACG 

AGATAGAAGGGAGGAGTTTCAATATATATCTTGTGAATAATAACTTCGTTCTAATTCACTATACACAACT 

AGACGTGTACACGCTCAATCTCAGGTAAAGAAAGTTTATATTCCATCAACAGTACTAGTATTAGTATTAG 

TAGTTGCTTTGTCATATACAAATAGATTAATTAAACTAACTAACAACCTATATCAAATCAAATCATCAGT 

TATATCATCATCAACATATTCATCATCTTTATTCATTCTATAAATTGTCATTGCCATACTTGCAAAATTC 

AATAAACTCATAATCCAATCCGGCAAAGCAATTCCATATAATTCAATGAGATTAAATGTTAAATCTAAGA 

AATTCCCAATTAATTCAATAATAAGCATCATTTTATCAAATCGTAAATCTTTTAATACTTTTTTGTATTT 

TTTATTTAAATCTTCATTTATAAAATTTATTCCAGTCTTGTTTTTAGTGGTGGTAGTAGAATTTAATAAA 

TCAACTTCAATATTAACTTTTCTAATTTTACGTATTACATTTAGTAATTGAGATATGGTTTTCCTGATTA 

AAAAAACCAATATTAATACCCAAATTTTATTGGTTTGTTTTAAAAATCGATTTAAAAATTGTGGGAACAT 

TGGTAAATTTGATAATAAATGTAAATTATCTAATAAATTGGCAAGATTTTCTAAAATATTAACAAACATA 

AATTCTATTTTTTTCAAACTAAATGTATTTGGTCTATAGTATTTTATAGGTTTATTATTATTATTAGGTT 

TACTCCCTGACTTGGGTTTCTTCACTGGAGATTGACCTCGTTCTTGTCGATTGTTGTGAGATGATTTATT 

AATATCAAATTTATTAAATACTGAAGGGTATTTTGGTTTTGGAGGTAATTTAGCCTTAGTAGGGGTTGAT 

AATGGTTGTGATCGACTTTGTAACTTTTGTTGTTGTTGTTGTTGTGCTAGTAAAATGGTTAATTTATCAA 

GTTTATCTGATGTGATTGAAGTATTACCCTGTTGTTGTTCTTTTTGAGCTAGAAGAAGTAAATTATTGAT 

AATTTATTGTTGACGTGAGTCAGGATTAGGATCAATTGAAGTATGTTTTAAGTTTAATTTTTGAATTAAA 

TCAATATTCTCCTGTATTGTTGTAGTGAACATTACGGATATTAATAATAAATAAA 

>retrotransposon_09 1483bp public: 1..525, Incyte: 526.. 1483; Tca2-like LTR 
871 . ,1150 

TGAATAATCAGGGGATGCAAGTTATTGATTTTGCCAGTATCCAATTTTACTTGTGGTTTCGAGAAAGTTC 
TTTCTCTCATTGGTAGTTTAAAGTTAACTGAAATTCAAATTATAGGAGTTTTTGAACATAAAAAGCATAT 
ACAACTTGAGTAGCATGTATATATTGCATATAAAGATTCTTTTTTTTTGTAATTGAGTTTGCCAAACATT 



TTAGTCACTCCCAATATATCGTCAACTCGTAAATGTGATAATTCAGGTCAAGTGCCTACCTCTAACGATT 

AGCCAACATTTTTTGAAACAAAAATATATTTCAAAGGAACACAGTGAAAACCTCTCTATGTAGGCTGACA 

GGTGAAAATTATGAATTAATTGCATTGGCCAATGACAAATGAATAGACAAAACAGCAAATAAGGTTGCAA 

AAGTAGCCCAAACAAACTAGATTTCGGTTACGAATTTTCCATCTTTCAAAACAATGAATTTGTTTAGAGC 

TCTGTGCCATTTATTGCAACTAAAATGAATATGCAATTAAACAATCAGAGATGTATTGGATTATCCCCGT 

GGTATACTTTTGAGTTCACCATTTGTTTTTTTTTTGGGGTTAAATTAGTGCTCCTACTAAAAATCGCATT 

TATCTTACACTCACCATTTTGATAAGTTATCTCTGGTCAATCGCAAATACTATGCTTCTAATTAAGAGTT 

CTATGTAAATCCCATTTATTTTGATCAATCTATTGGTTTGAAGTAAGAGTTGATTTTCTGTAAAGATTTA 

TTTGACAGTGTAGTTCGGTGTCAAAAATATATTATGATGTACACTAAAAAACACTAAATTTCAAGTCAAT 

GGGGAACACAAAACTGAATTAATTACTATATGTTGGTTTGTGCACTATTTTGTGTCAGAAACTGATCAAT 

GAAAATGATGGTTATTATGAGAATGGAAAATTTTTCCATCACACATCAGGTGATGACAGAACTAAACTAT 

ATTGTGTAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATCAACGAGATAGAAGAGAGGAGTT 

TCAATATATATCTTGTGAATAATAACTTCGTTCTAATTCACTATACACAACTAGACGTGTACACGCTCAA 

TCTCAGGTAAAGAAAGTTTATATTCCATCACTATATAACAACAATCAGGCTTTGCAAAAAAACATTTAAA 

ACTAATACTGGTAATATGGAAATATAACGCCTCGTAGTTCTACGCACGTGGCATCCTTTATCTATTTATT 

CAATTTACCCCTAATTTATGAATTAGCTTAATAAGAGCAGTCAAATTAACACGGCTCAATTAATAGTACT 

TAATAATATGAAGCCGATCAATTAACCGATCCTTTGAATAATTTGAAAATAAAATAAAGTAATATAAATA 

GGTATGCATTTTCCCTACATTTATTTCCTCTTTCTATTTTAATTTGTTTCCTAAACAGCAACAACAACAA 
TTGAAATTCAAAA 

>retrotransposon_10 879bp public: 1..879; Tca2-like LTR: 326 605 

GGCTCGTAGATTCGGTATACTTGTCTAGAATAAAAATGAAAATGAATGTTAGTTGAAATGTCAGGTGGTG 

GTGGTGGTTTTTTTTTAGATTTCAAAAACTATACATACTCCTATGAGATCAATTTTCTTGATTGAATATC 

TTGGTAAAATGGTTATGAGTTCATTTTCTGCCAAAAAGGTAATTTCTGATGGCATAAGATTCCCTTGAAG 

GTTTTTTGGGAGTACCATGACGGGTTAAGGATTATTTGTTAATGGTTAAAACTAGATAGTAGTAGTCTAT 

ATTTAATTTATTTTTTTTTTTTTGACACCTTGTGCGAAAGATCTCTGTTGGTTTGTACACTATTTTGTGT 

CAGAAACTGATCAATGAAAATGATGGTTATTATGAGAATGGAAAATTTTTCCATCACACATCAGGTGATG 

ACAGAACTAAACTATATTGTGTAGTATAAATAAGGGTATGAAATACCAACATCCCAGAATATCAACTATA 

TAGAAGGGAGGAGTTTCAATATATATCTTGTGAATAATAACTTCGTTCTAATTCACTATACACAACTAGA 

CGTGTACACGCTCAATCTCAGGTAAAGAAAGTTTATATTCCATCAATCTCTCTCGATGTTGTAAAGAGAC 

GCGTCAATTAACAATAAACTCTAATTTTGTTTTTCTTCTACAAAACTACCAAACATAATCATGTCAAGGT 

AAATTACAATGATATTTAATTACGTAAATACTTCTATACCCTTATTGATATTCAATCATTTTCTTCTTAT 

ACGTGGAAGTTCTTCCAGATGTCATGGCCTTGGCCCTTCTAGCAGGTTTTGGACCGTCACTATCTCTACT 
ATACGGGTCAAATCCACGTCTCTGTCTACCATTAGTCTA 

>retrotransposon_ll 974bp Incyte: 1..974; CTA2 (transcription factor)- 
DOin{<974. .>778,<223. .>1) , Tca2- like LTR: 483 761 

ACCCGTCTAGTATCAGCTCGTCGTTTTCAAGTATGTTGTTCATGTCCAGGTTGTTGTCTGTGGTGGCAGG 

TACTTTGTCGTCCAATTTTAGGTCCTCGTAGTCCATGTTGGACAACATGTCTTCGTCGGTATTGCCGTTG 

ATGTCAAAGCCAATAAAGTCGTCAAAGTTGTCAAACTTTTGTGGGGCGGTCTCTGCTTTCTTTCTGGCCT 

CTGCTTTCTGTTTGTTTTACACTTTTCGTCTTTAATTATAGTTTCGAAGAATTTCCTAGGAACTTAAGAA 

TTTGTAGGAGAATGCTAATAAGAAGTTGTATTTCTTAATTGAAAGTTATAATTGTAAGAATATATTGTAT 

AAAAGATGAGTTGATAAAGAAAAGATATAAAAAGTCCTATAAAAAAGTATTGTAAAATAAAAGTATATAA 

AAATCAAGTAAAATAGAATATTTGCACACAAATTAAAAGTAGTGCAAATTTGACAGAAAAGTTGTTGGTT 

TGTGCACTATTTTGTGTCAGAAACTGATCTATGAAAATGATGGTTATTATGAGAATGAAAAATTTTTCTT 

TCACACATCAGGTGATGACAGAACTAAACTATATTGTGTAGTATAAATAAGGGATGAAATACCAACATCC 

CAGAATATCAACTATATAGAAGGCAGGAGTTTCAATATATATCTTGTGAATAATAACTTCGTTCTAATTC 

ACTATACACAACTAGGCGTGTACACGCTCAATCTCAGGTAAAGAAAGTTTATATTCCATCAAAAGTAAAA 

TAAAACACTTCTTCGCTTCCTCTGCTTTCTTGGCTTGCTCTGCCTTCTTGGCCTCTTCTTCCTTCTTTCT 

TGCCGCTTCTTCTTTGACTTTCAATTCGTCAAGTTTCTTTTTCTTTTCAACCATAACGCCGAGACACCAC 

TCTGCATCATTGAGTTTCGACACTGTTTGGTCTAGAATAGCATGGAAGTTTTGGATTTCGCCGT 

>retrotransposon_12 3868bp Incyte: 1..1295, public: 1296.. 3868; Tca2-like 

LTR: 127. .407 

AATGAAGTAACTTTTTTCAAGGCAACATCTATTCTTTTATTAATCTCGACGTCTGTTTGATTAAGTTGCT 
CTAACATTTTATTTAGATCCTTCTCTATATTTTCTGCAATATCAAACACCGATTGCTTTTTGTCTGAAGT 
TGCTGGTATATCACCACTTCCGCCAATTGTCGTATTTCCACTGTCCTTTGTTACTGACAGATTGGCACTG 



ACATTACCTGAATTGTTCATGTTTGCTGTTGAAAGAGCAGGAACTGTACTTGGATAAGCAGCCGATTCAA 

AAGAAGATGTGGACATGAGTGTCAAGAAAATGTGTAGAATCAGTACAAGACTGGAAAACAGAAGGAACAA 

AGTGAACTGGATATTGTAGTTTTGTTGATAGTACTCGCGAGCTTTAATTTTTTTTTGTAACTGGCGGAAT 

CAGATCTTATGCAATACTCAAATCCAAAGAAACAGTCAATCCAGATGAAAGGCATGTAATCGCTAGTTTT 

CATAAACAGAATCATGTTACTAGTCATATTTTCTATAAAAATTCAATACTTCATTCTTTTTGTTCAATAC 

TAACTATAAATGCTTACAAATAGATTCAAATTTCAACCAGATCCACCACTTCATTAGGCTCAACCAATTC 

TTCATAAATAGAAACGTCTTCCTCAGCCAAGCTTAATTGATGGGAAACCCTAGCTTGCATTGAAGGAAAA 

ATACATAATCCAAATAANCAACTGTCTTTCCAAATATTCTCAAAATTCAACTTCACCGTCTTTCACCAAG 

CAGGATCTCGTGATTGGACCAATTCTAATTCAGAAGTTCTTCTCACACAAGTCCGAACGACTCGATCCAT 

CATAATGGATACATCGTTCACGTTGCCACCAAATCGAATGACTCTGTTTGCACCTGTACAAAGTAGAACA 

TATGCATGGAAAAGTAAAACTAGTAAAACCGCATAATGAAACCAATAATTCATCATATGTTGATTGAGTC 

TGAACCCCATCAAATATAAAACAAAAGTGAGTTTAACCATAGTTATAAGAAGCAGTCTTCCGTTGGTGTA 

TAATCTATCCATAAGATCGTCAATTTCAGCATCTTCAACATCAATGTTATTAGCGTCACCTGGAACGGCT 

TGTTCATTAGATTCTGATTCCAGGTCACTACCAATATCATACATCATTACTAGTACTTTTTGAATCAATG 

GCTCACCAGAAGCCAGTTTAAACACCTTGTGAACTTTTGCTGCACCCATAGGACCGAGTAGTAGATAAGG 

ATCGTGCAAGCCGTTATCCACAACAATGCATTGTGCTGTACCCAAGCTTACTTTCTTCACAATATTGTCT 

ACTTTCAAAGTAAGTTCATACTCAACATTAGACAAGTCATCCTGTTTCACTAGAATTTTTTTCCCTGAAT 

GCTGTTCAACCATAGTATCGTACGATGTTCCCTCCATTTCCCATGTGGATCCACCACGTACCTGAATACT 

GGCAGGTTTAATGGGGTCTATGTTAGGAGTTGAAGACTCTGATGGATTATTGACAAATGGAATAGAGTCT 

TGTTGACTTGGCACCAGCGTTTCATAATTTGAAGGTGAAGGTACTGGGTTAGCCGAGGTTGGTGATGTTG 

AAATATCACTATCAATTCCTTGTTCTGAGGATGAGCTAGTAGCAGTTGGATTTGTTGTGCTTCTTGCAGC 

AGACAAATCTGATGTTGATTCTAATGGCACTGAATTCGACAGCGCCAAATTGGGTTGCTGTAAAGAGTCA 

TTGGTGGCAGGGAGAAATCTAAATCTATCATTTGACTGAAAGTCCTTCCAAAATTCTCTGCTCAACAACC 

CACCAGTTCCATTTACATGTTCATGCTTTGTAAGTTTCAATTTTATGACACTGTTATTCTGTTCCAAAAG 

CTCTTGATTCAATCCCAACAATTCATAAACACTAGCTTCCTCTTCTTGAAATGAGGTTGGTATTATATTC 

CCTTCGTATGATAGTTTTATTTGTTCTATAAATGTACGTGTGACAGAACCTTCGTCATTCTTAGCTATTA 

TTAATTGCTTGAGTTGCTTAACCGTAGTTCGGTCATTTATTTCAATCATTGACTTTTCATTCTGTAAATT 

AGGAAGATTTGACTCCAACAAAACCCGGAATCTTTTGAAATTACTATTCATTTCTAAAGGTTTGGGTTGT 

GTGATTGAAGCTAATGGTGTGTGTACTAAGTGGTTTTTCAATTATAAATATTGATGAACTACACTATATA 

TACACTGAGAAAAACACGACCAAAATTGACACCGCACTAAAAACACGGAATTACCGTATTCTTTTTGTTA 

ACGATTTTGTTTCATTACACGACTGTCGTTATACACACATTTAGAGCAAATTATTTTAGATTGATCAGTG 

TTAGCAACTGGCTATCGATAATAGAGTACCTTCCCGAGTTAGAATGTCTTATTAGAACAACAATTGTTTC 

ATATAAATTTGTCGCAAAGCACACGTAATATACTATATGGAAGGGGCTAAGTAAAAATGTCCCGTTTCTT 

CTTAATATGAGAACTCGTGTACGACACAATTTGCTGTGTTGTTAATCGAGTATGCTACAACCTGAAAATG 

GACCATAGACCCAAACTACTTCTCTCTTTCTAGCACCACAAACCCCACAATTAGCACAACAATGAATTGG 

ACTTCACTTGTATATCTATGGTTCATTTTCAAAAGCATATTTGCTGACTTAACATCACACCAACTCAAGA 

GCAAAGTGGTATTCCTAGATACTACTATCCTGGATGAAGTGGCCCGAAGCTATTTGGGATCAGAGGACGG 

AAATGTTACACATGGTAATTATGAAATATTGTCAATTGCAAATGGGCGCCAATGACGGAAACATCACATC 

ATATTTATGCCAGTTGCCAAGAACCAAAAAAATGGCACCAACAAAACCCAAGCCCACCATGTCAGTTCAT 

GAATTGAAATCGCGAGCTATTGACTTGATATCGGAATCCTTTGTCGAAGGTACCAGTTGCGTATTTTCTT 

TCAACTTGCATGCAAATTATTGGACTATAG6CTATTGCCATGGAATCAACGTTATTCAATTCCATGAGAA 

TTTGGATGATTTTATAAGCGGAATTCATAAACCCCATTCTCCAAATCATGTATATACATTAGGCAATTTC 

CTGAAGCAAACACTGCCATTAGAATTCGAGTTTGATACTAAAGAACGCACAATAAGTCAAAGATTGTTAG 

GAGAAGTTTGTGATTTGACAGGAGAACCACGTACCATTGACACCATTTATAGATGTGACCATATACTTGA 

AATTGTTGAATTAACAGAGATAAGAACATGTCAATATGAGTTACACATAAACGTTCCTAAGTTGTGCCTG 

TTGCCGGAATTTAAAAGGACTAACCTTGAAGAAGGTGTCTCAGAAATACTCTGTACAAGAATTGAATAAG 

CATTAAATTTAATAAAAAACATCAAAAAGTGTATGTCAAAGTATTTTTACCTTTGTAATTAGTAGTTTGT 

CAGTTTCTATATAAACATAGGGTAGTTCGTATATACGATATCGGAGCGATTCTAAATAAGTCGTGGAAAT 

TGGCCGACAATGGGATTTGAATTTTACTTGTGTGTGTGTGTGTGATCTGAATAATAGTAGTGCTAAACAA 

CTTAAATTAAAGAAAAAAAGACAAAACAAAAAAAATTAAATCTGCTTATTGAAAATTTTTCGAAATAGGC 

TAACCCGTGTTTATTAGATATTAGATAGTACGATTTGTTCAAGTGTCAAAGATAGCAAATTTTTATTGTT 

TCTTCTTTTTTATATACAGCTTGTTTTAATTTCAGGATCATTTTACACTAACCTACTCATCAGCCTATTT 
TAATTTATCCTTTTGGCT 



>retrotransposon_13 469bp Incyte : 1..301, public: 302.. 469; Tca2-like LTR 
75. .355 

TAACGAATGAATATAAAATACTTGTATTATGTAGTGCCAATAAAAGTTGAAACGGTCGCACTACTTTTTA 
GTCCTGTTGGTTTGTGCACTATTTTGTGTCAGAAACTGATCTATGAAAATGATGGTTATTATGAGAATGG 
AAAACTTTTCCATCACACATCAGGTGATGACAGAACTAAACTATATTGTATAGTATAAATAAGGGTATGA 
AATACCAACATCCCAGAATATTAATTATATAGAAGGGAAGGAGTTTTAATATATATCTTGTGAATAACAA 
CTTCGGTCTAATTCACTATACACAACTAGGCGTGTACACGCTCAATCTCAAGTAAAGAAAGTTTATATTC 
CATCAAGTCCCATCTGTTAAATATTTTTGTATCTTTTTATTTTTATTTTTTTTTCTTTTAATTTCATTTA 
CATACATTAACACATCTACTAACCATATATCACGAGATACAAAGGCAAG 

>retrotransposon_14 (direct) 4545bp Incyte: 1..4545; Tca3 LTR: 1..314, 

4234.. 4545, POL fragment 1: 577..>3324, POL fragment 2: <3443..4201 

TGACGATCCTGTATATTTCGTCATAATTCACACATTCTTAAAATTATGCACACATCCTTGAAATGTGTTA 

ATATTCCCAACATTATCAATTATATGTGTTCAGAATTGGTTGCAAAGTTATCAACTCAATTCACGCTATA 

TAAACCTTACAAATTCTCTACATTTTTATATTTTTTTATATTGGCTTTTCTTTTAGAATCAATCAATACT 

TTTTTTATCATTTAGATACATCTTTCATCTATTAATAGATTATCTTTCTATATATCAAAACACGACACAG 

TCACGTGCCAAAAAGGATATAAGAAGGAACTTCAGAAAATTAATTTTCTGATTATACTACTTACTAGATT 

GCATAAAGTCAATATCTGATTGATACAACTTGGTTCATTATTCATAAAACTTAACAACTAATTCAACAAG 

GAAACCCAACAAAAAAATCCAAATAAAATAATCAGGAAAATATTATAATTAATTAATTACAAAAAAAAAC 

AAAAAAATACACACACACATACACACACACAAAATCTTGTTGCAAAAAAAAAAAAATAATAATAATATAA 

TAAGAATTAATTAACAATGTCGTTTCCACGGACACATTCACCAAGACCATCTGGTTCACGAGAACAGGAA 

GATCTCACACTGATGATTAAAGCTTTTAGAGATTCAATGGAAGCTAAGCTTGACTTGCATTCGCAGAAGC 

TTACTGCTTTGGTAGCAAACATTCCCAGAACGGACGAAGGGTTTGAAGATTTATCACAAAGGATCACTGT 

TCTTAAAAATCATCAAAAAGCATTTTTGCCCAAACAAGAAAAAGA7VATCGGAAGTCTTCTCCACAGACAA 

AGAGAGGAAGAAGGTGATATTAAGGATTTCAAAACAGTCGTTGGTGAAGAAAAAGAAGAATTGCACCAGG 

TTGAAGATTTCGTTTTAAAAGATCAAGAAGAATTACGAAACGTCGAAAAGAAAGTTTTGAAAGAAGAAGA 

AGAATTGCAAAAAGTGGAAGAGTCAATGGAAAAGGAAAAACAAGAGTTATACCAGGTTGAAGACTTTATT 

TTGCAAAGAGATGAGACGGTAAAGAAACTTGGAGAAAGCAATCAATCTCAACAGGAACCATATACACCTG 

CAACTTCTGGTTCGGATCAGAGATTCAGATCTCAACAACCTAACATTGGAAATACCTTAGCGCAGGATCT 

AGCATTAATTCCAAAATTAGATCTGGAAATTTGCAAAATTGCAGTCAAATATCCAAAATTATTTGAAACA 

AAATTAAGACCACCACCACCCAGAGACTTTCAATATAAAATTCAACTCACAGACCACACTCAAATTTATT 

CAAAACCATATAAATGCAATCAAGAAGAACAAGCTCTCATTAAGGATTTCATCAATGAAAAATTAGAAGC 

AGGCGTTTTGGTACCAGCTCCAATTGATGCTTGGTTACACCCAATATTTCCAATCAGAAAAACCAATGCC 

AACCAATCCTCCACCAAAATAGCAGTTGATTTAAGACGTCTCAATAAGGTCACAGTACGAATGTACACTT 

ATCCAACAGACACAAAAGACCTCTTATCCTCACTAACAGATTCCCACTATTTTAGCGCTTTAGACTTAAA 

GAATGCGTTCTATCAGGTAAGCATACACAAGGATAGTATAAAATATTTTGGGATTTCAACATCCGAGGGG 

AATTATTGCTTTACAACTTTACCGTTTGGAGCAATCAATTCCCCAACCATCTTTACTAACTTTGTGAGAC 

AGATTTTAGAGGGGATCCCATGTATATTTATATACATGGATGATATCCTCATCCATACTAAAACCTTACA 

TGACCACATGTCATTACTCAGGAGAATCATGGAGAAACTAAATGAGCATCAGTTTCAAATGAATTATAAC 

AAGATGCAATTATTAACAACAAAAATCAATTTCTTAGGGTACAGCATTCAAGCGAACAAAATATCACCAG 

ATATTTCCAAAATTCAAGCAATACAAAATTGGGAATTGCCCACGACCACTACTCAAATCAGAGCATTTGT 

CAATTTCAGCAACCACTTTCGCATCTTCATCCCAGAAATAGCAAAATTTACTAATCCATTAAATGAATTA 

TTGAAGAACAACAATGGTAAAAACATAAAGATTGAACACACCCAAGCATCCATTGATGGTTACAAGGCAT 

TAAAAGCCGCCATCATTGGATTGCCGACGCTTCAACTTTACAATCCAAAACTACCAACCATCATTTTCAC 

AGATGCTAGCCACATGGTAGTAGGAGGATATTTATGTCAACCAACATTCAGAAATGACAAAGAAGTCCTT 

GTCCCAATTGCATTTTCATCACATAAATTAACAGAAACACAAAGCAGATATGCTGCTATGGAAAAGGAAC 

TTTTGGCAATTATTGTGATATTGGAAAAATTTAGATATCACTGCAGCAATACGGTAGAGATCTATACAGA 

TTATCAAAGTTTGGCATCATATTTAGATAAGAAAACTACTCCACCACCGAGAATTGCTAGGTTTTTAGAT 

CTAATTGGATCATTTTCCCCAAAAGTGTACTATTTAAGTGGAAAGAAAAATTTCGTTGCTGATATCATTA 

CAAGATATCAAACTCAAAATATTAAGGAATTGGTAGATGAAGACAAGATACTAGGACAGACTTTTACAGT 

CAAGAGAAATTTGAAACAACAACTATTACCAAGATTGGAAGCAATTGAATTGGAAAATCTTAATGAATCA 

CAGGTTCACAAAATCCAAACTTCATTAGAACAACAACAACAACATGATTTGGAAGACAATGATGAAGAGT 

TACCTCTCCAACTGTTTAAATTAATGAATGATGAGTTATTTGTAATCATTAACAACCAACTTTTAAAATA 

CCTTCCAAGACTGGAATACAATGATATTTGTCAAACAATCCATGACAAACACCATCCATCAACTAGAGTA 

ACAGACTACTTATGCACACTCGCATATTGGCATCCTGACCATCTATTAATTGCTACAAACATTACGAGAA 



AGTGTCACTATTGTCAACTAAACACGTCAATTCGTGAGGCCATTAGACCATACCGACCACTTGAACCACT 

CAAGGCATTTAGCAGATGGGGAATGGACTACTCTGGACCATACTTTAACACAGTCCAACACAGGTACATA 

TTAGTAGCCGTGGAATATGTCACTGGTTTAACTATTGCAGTACCAACATTGCACAAAGACGCAGATAACG 

CAATCAGTCTTTTACAATCAATCATTCTGATCATGTCAGCACCTACAGAATTAGTTACAGATCAAGGTAA 

AAAAATTTTCATCACAAGCTTTGGCTACCCTATGTGACCAGAATAACATACAACACCATATTACCTCCGC 

CCACCACCCACGTGGGAATGGTCGGGTTGAGAAGGTGAACCACCTATTGAAGAAAATATTGAAAGCATTA 

ACTAACGATACGATGCAAGACTGGGATTTAAAACTATATGACGCTTTAAGAATCTACAATGCTACACCTA 

CAATTTTTAACTACACTCCACTTTATCTTGCACTTGGAATTGAACCACACCATAATTTAAATCAATTACA 

AAAAGATTTAATTGAAAATTTGCAAAAAGAATTGCCCCCAGAGGTCCAATCCACAGAAGAACACGAAGAA 

AACCCAAATGATGAACAACAAGAAGAGGGCAGAGAACAACAAATTTCAAGAGAAGAACAACAGGACGGCA 

GAGATCTTGTACACTTAAGAATTTACGAATTGGAAGCAATTAAGAAAGCTCGCAAGTTACACACAAATTT 

GAAAACACGAAGAAACGCAGTCCAAAATATGTTAAAGGAACCATATGGCATTCCAGCACCTTTTACAAAA 

GGACAATGGGTATACAGAATTAGAGCTAAAGCACGAAAATATGAACCAAATTTCGATGGTCCATATCAAG 

TTCAAGAAGTATTAGGTAAAGGTGCTTATAAATTGAGAGACATCACTGGAAGAGAAAAAGGAATCTACAA 

TCAGGATCAATTGAAGTTAGCATATTCAGCAGACAACGACCCAATACAGGTTTTTAGTTCTTTCAATAAA 

GAATATGATCGAGTACAACAAAAATTGTTAGACAAAATTCAATCGGAAAGAGATCATCAATTAAATTGTT 

TGTCAGTCCAACATTTACACAGACAAAGAAGGTTACTCGATATATCCAGCTGTCTTGAGCAAATTCTGCA 

ATAATTTCGCTAATCATTGGAGGAAAGGGTAGATGACGATCCTGCATATTTCGTCATAATTCACACATTC 

TTAAAATTATGCACACATCCTTGAAATGTGTTAATATTCCCAACATTATCAATTATATGTGTTCAGAATT 

GGTTGCAAAGTTATCAACTCAATTCACGCTATATAAACCTTACAATTTCTCTACATTTTATATTTTTTTA 

TATTGGCTTTTCTTTTAGAATCAATCAATACTTTTTTATCATTTAGATACATCTTTCATCTATTAATAGA 

TTATCTTTCTATATATCAAAACACGACACAGTCACGTGCCAAAAAGGATATAAGAAGGAACTTCA 

>retrotransposon_l4 POL fragment 1 916aa 

MSFPRTHSPRPSGSREQEDLTSMIKAFRDSMEAKLDLHSQKLTALVANIPRTDEGFEDLSQRITVLKNHQ 

KAFLPKQEKEIGSLLHRQREEEGDIKDFKTWGEEKEELHQVEDFVLKDQEELRNVEKKVLKEEEELQKV 

EESMEKEKQELYQVEDFILQRDETVKKLGESNQSQQEPYTPATSGSDQRFRSQQPNIGNTLAQDLALIPK 

LDSEICKIAVKYPKLFETKLRPPPPRDFQYKIQLTDHTQIYSKPYKCNQEEQALIKDFINEKLEAGVLVP 

APIDAWLHPIFPIRKTNANQSSTKIAVDLRRLNKVTVRMYTYPTDTKDLLSSLTDSHYFSALDLKNAFYQ 

VSIHKDSIKYFGISTSEGNYCFTTLPFGAINSPTIFTNFVRQILEGIPCIFIYMDDILIHTKTLHDHMSL 

LRRIMEKLNEHQFQMNYNKMQLLTTKINFLGYSIQANKISPDISKIQAIQNWELPTTTTQIRAF^ 

FRIFIPEIAKFTNPLNELLKNlSnSTGKNIKIEHTQAS IDGYKALKAAI IGLPTLQLYNPKLPT 

WGGYLCQPTFRNDKEVLVPIAFSSHKLTETQSRYAAMEKELLAIIVILEKFRYHCSNTVEIYTDYQSLA 

SYLDKKTTPPPRIARFLDLIGSFSPKVYYLSGKKNFVADIITRYQTQNIKELVDEDKILGQTFTVKRNLK 

QQLLPRLEAIELENLNESQVHKIQTSLEQQQQHDLEDNDEELPLQSFKLMNDELFVIINNQLLKYLPRSE 

YNDICQTIHDKHHPSTRVTDYLCTLAYWHPDHLLIATNITRKCHYCQLNTSIREAIRPYRPLEPLKAFSR 

WGMDYSGPYFNTVQHRYILVAVEYVTGLTIAVPTLHKDADNAISLLQSIISIMSAPTELVTDQGKKIFIT 
SFGYPM 

>retrotransposon_14 POL fragment 2 253aa 

MQDWDLKLYDALRIYNATPTIFNYTPLYLALGIEPHHNLNQLQKDLIENLQKELPPEVQSTEEHEENPND 
EQQEEGREQQISREEQQDGRDLVHLRIYELEAIKKARKLHTNLKTRRNAVQNMLKEPYGIPAPFTKGQWV 
YRIRAKARKYEPNFDGPYQVQEVLGKGAYKLRDITGREKGIYNQDQLKLAYSADNDPIQVFSSFNKEYDR 
VQQKLLDKIQS ERDHQLNCLS VQHLHRQRRLLDI S S CLEQ I SQ 

>retrotransposon_15 2093bp Incyte: 1..2093; TcaS-like LTR: 1509.. 1822 

TTTTCCCACAAATAATATCAACAATATTTCATATTTTCCATCATGCTAGAGAAGATCAAGTTATAACTAC 

ATTAATTGGTTATGTTTATAAATTGACTCAAATTTGTTTAAAATTTGAATTACATTCTGAAATTAGAAAA 

ATCATTGATAAATTAATTAAATTTACTACTTTAACTCACACACCTAAAAACCTTAATGAAATTTTAATTA 

CTGAAGTCAAATTAGATAATAAAACCGAAATTTATGTTAGTGATTATGCTTGTTCATTTGGTCGTGATTT 

TAAAGCTCAATTATCAACGGTGGTTTTATTTAAAATAATCAAGAAAAATAATCTTAAATTGAAAAATTGG 

GATAAAATTGTGGAAATTATTGAAAAATTATATCAATATTCATTGATTATTGATGAGAAGGATACTACTA 

CTACTACTACTACCAATGATAATAAGGAAGGTGATGATGAAAAGGATAATAAGGAAGCCACTGTTGAGAC 

TGACAACTCAATATTGAAATTATTGCCTTCAAAAGATATTAAAAAATTCCCTATTAAAAGAATAACTAAT 

GATCTGTTTCTTTCAATATTGAAAAATTTAATTGATAATCAACCTACTGAAGAAGAAATTCAATCAACTT 

TAGCAGCTATGGATTGTATTAAATCATTAGATATCTTGAATGTATTAAGAATTGTTGCTGAATCCAAGAA 

ACAAGCTAACTAAATCTAAACAATCTAAACATCTAAACATCTAAATATATATATATATCTATTGTATTAT 



TATATTTGTAAAATTTTGTAGTTTGCAGTGGTTGGAATAAATGATAGGAGGATGTTCCATTTGTGATACA 

CTATTTCTACAAACTGTCAAATTCAATAATCAAACTTGTTGCCAAGAAAAGATAACAAAGAAGGCTATTT 

GGTTTACAAGGTACAACAAGAACATGGGTATATCACCACGATAGTTTAGTAATTTTGTAAATCTTCTTTC 

TCTGTTTTACTTAGCCTCATTTAGTCCTTTCTTTCAGTTCCAAAGTAGGATGTGCAACATGGCCAATTAT 

CAACAATAAGCTAGCATTGCATAATGGTAGTGATTGTACTGAAGAGAACAATACACTAATCTATTCCATT 

GACGACGGAATAAGTGGACTGATAATTCACATGGATAATTCAGTCCACTCTGAGAGGAATTTCCTCTTTA 

TATAATAGAAAATTCCTCAAGGTATTAGATTGTATATTTTCTATAGATAACTAACCTTGAACACAAGAAT 

ACTATCGCCTTTCGTTGCAGATTATCGCTCAAAACTTTTCAATAACTTTTGGGTCTTTTTTTAACAATAA 

CCAATAAATCATTACAAAGAATTACAAAAAGGGCTATAATGACAAATTTCACATAGATAAGAAATATAGG 

TTTTATTACTTTTTGCATAATTGCTGACTTCTATTTTTGGTTTGGAGATATTTAGAACGTTTGATTGTGG 

GGGTATTACTTCCAAAAAAAACAAAAATTTGTAAACCCTGACGATCCTGTATATTTCGTCATAATTCACA 

CATTCTTAAAATTATGCACACATCCTTGAAATGTGTTAATATTCCCAACATTATCAATTATATGTGTTCA 

GAATTGGTTGCAAAGTTATCAACTCAATTCACGCTATATAAACCTTACAAATTCTCTACATTTTTATATT 

TTTTTATATTGGCTTTTCTTTTAGAATCAATCAATACTTTTTTTATCATTTAGATACATCTTTCATCTAT 

TAATAGATTATCTTTCTATATATCAAAACACGACACAGTCACGTGCCAAAAAGGATATAAGAAGGAACTT 

CACCCCCTTGCTCTTCTTATTATTGTGTGTGGTGTAAGTTCAGCGGGTAGTCCTACCTGATTTGAGGTCA 

AAGTTTGAAGATATACGTGGTGGACGTTACCGCCGCAAGCAATGTTTTTGGTTAGACCTAAGCCATTGTC 

AAAGCGATCCCGCCTTACCACTACCGTCTTTCAAGCAAACCCAAGTCGTATTGCTCAACACCAAACCCAG 

CGGTTTGAGGGAGAAACGACGCTCAAACAGGCATGCCCTCCGGAATACCAGAGGGCGCAATGT 

>retrotransposon_16 2099bp public: 1..2099; Tca3-like LTR: 1565.. 1878 

ACATTTTTCAATATTGAAAGATAAATATAGCATTCCAAAAAAAAAAGTGACTTCTGTGTTCACATTTAAT 

CAACAAATTCCCACAACAGCTTGCACAAACTGCTATCTACTAGGCTTACGAGACACAAGTGTTACCAAAT 

AGTGATACACTTATACTTTAACTCATAGAAGAGAATTAGATACTCGGAATATTACTCAACATATTCCCAA 

AATAATCGTAAAGATAAATCTTTGAGAGTTAATACTAGAGAGCTCAATTCTAGGCACAAATACCACACTT 

TTTACGAGTAGTGGGTAAGAGTTCGTACACATGATGCAACAACTTTCTAGTACCTACTTGCACAAAGTGT 

AGTTTGCAAAAAACTTTGCTCCTCCATAGCATGTATCTCAATACTCCAGAAAATCCGATAAAGCAACTCT 

CCGATGGTCATGCAAGTATTCGCCTTTCTCTTTTGTAGATTTATGTAGTTTCAAGATGACACTGAACTCC 

TGAGTATTAAAGTAGATTAATAATAGAAGGTATTGCCTAATGCCGAGAAAGTAAACACCAGATCAAATAT 

ATGCTTTACTATGAAACTTGTTTGTGTTGTGTGGATTGGCCAAACAAAGATCATGCTGATATCTGTAAAT 

CTCTGGAACGGGGGATAGGAATAAACTTGAAACAATATAAACGAGGTGTTTTCCTTTTCTGGTGCTTGAT 

TTGAAACGTGTACATTCCCTCTTTTTCTCTTAGTTAACAATATTGCATAATAGTGAGGATGTGAGCGTAA 

GACAGAAAGCAGCAGCATGGGAATAGTTCAGCCTATTATTGTCGCAAAGCTGCATATTGCTTCTTCTATT 

AAACTTTTGAATCTTCTCTTTTAAGTAAATTAATTAATAACTTGATTGTTCCATTTACATCCATTTTCTA 

TTTCTGTGTAATCTTCGTTTATTTTGCGGTTTGAATACTTCCAAATTTAATTAAATTTGTTCCTAAAATA 

GAAGCTGTTATACTTGCGCCGCCAAACCCATTTTAATAGTGATCCTTATTTCAATTTAATTTGTTCACGT 

TATATCTCTGAATTTGATTAATACTTGCTACAGATATTTGGAAATCATAATTTATGATTTCTCCGGAATG 

TAACTGAGTGGCCAGAAGATATATAGTAACACATAAATACGTACACAACACCAGAACAACCGCAACATTC 

AAGTGGAACTAGTATGTGTTGAAAAAACAGACAAATTAATCGGGATAGGAAGAGATGGGAAAGGGGGGTG 

AGAGAAAAGCAAAGAAAAAAAAAAAAGAAAAAAAAGAACAAAAATCAAATGGTACAAAAAAAAAGACACA 

TCTTCTACACAATTAACAAAAACTGCCTTCTGATGGCAAGAAATCTACCTCACATACATACTTAAATGGA 

ATAAAGAAAGTAATCTATAAAAATAATTTAACATGACTAACGTATTTCAAGTAAAAAGGTCAAAATTAGA 

GAACCCACCACAATCAACTATTTTCTACTCTCAATTGTTTTTTCTTTTTAGTTCTTATAATTATCAACAT 

TTTCCTTACTCAAATCTTTCACCTTGACGATCCTGCATATTTCGTCATAATTCACACATTCTTAAAATTA 

TTCACACATCCTTGAAATGTGTTAATATTCCCAACATTATCAATTATATGTGTTCAGAATTGGTTGCAAA 

GTTATCAACTCAATTCACGCTATATAAACCTTACAATTTCTCTACATTTTTATATTTTTTTATATTGGCT 

TTTCTTTTAGAATCAATCAATACTTTTTTTATCATTTAGATACATCTTTCATCTATTAATAGATTATCTT 

TCTATATATCAAAACACGACACAGTCACGTGCCAAAAAGGATATAAGAAGGAACTTCAACCTGTTCTTTT 

CTTTTTTATTTTTAAATTTGATTATTATTAATTTTTTTTTCCTTTCTTTCCTTACCAATTTTTCTTTGCT 

TGACTTATTCAAAAGGTGAAACAGGGATTTTCCAATTCACATAGCCAAAAGTATTTTTGGTTTCCACATT 

CCTTCAAAACAATATTTGTGCTACCTCCCCCTTCCCACCAAAAGTATCCGATTCCAACCATAAAGCAGC 

>retrotransposon_17 3284bp Incyte: 1..2749, public: 2750.. 3284; Tca3-like 

LTR: 2750. .3063 

TAATAAGTACCAACTAAATCAAAACAAGCGACCAAATTGAATAATAGGAAGACAAAAAAAAAAGAGAGAA 
AACAGTACCAAAATAGATATAGTATGTAGTTACATTTACTCAACATAGTTATTAGGTACAAATCCAATTC 



TGTAGCTCTCATCATCAATTCTTGAGACTCCAATCAACCAATTTAACTCATCTGAATGATACAATGTATC 

AATATTCTGAAAATCTAATAAAATTTCAATATTATCGCCCTGTTTJ^TGACAAATCACCTGGTTCATAA 

CCACTAAAATCGTATTTTGCAGTTTTCAAAACTTTATTATCGGTGTTAATGTTCAACTTTTCAAAAAAGC 

TTTGTATCAAATTCAACTTGTAAGTCAAACTCATAGGCTTTTCAAACGTAAAAGGTTCATACTGGATTGG 

CTTGGTTGTGATTGGGCTTTCCTTAATCTCATTCTTACTGCCATTGTATATCCTTCTTAATTTAGCTTCG 

GATGAATCATGGTTTGAGTACGAAACACTTGACATGGAGCTAATTGATGAAGCTTCTGACATAATAGTTG 

CGCTCTCGTCTTCAAAATCTGATAGCAGTATAGAATCCATAGAATCTGTAGAAATAGAATATAACCGTGA 

GGCACCTGCAGAAGACATTGGCGAGACAAGAACAGAATGCCTCATAATAGCAGTGTTTGACCTAGGTGGC 

AATTCAGGACCATCTTTCTTCGGCACTGCTGGTACCTTTATATCTTCCTCATCGACTAATTTCCGTGGAT 

GATATGTTTCCGATGGGTTCATCGATGGATCTTGGTACTGTTTGTATGCCACCAAGGGATCGATTTCTAA 

AGTATCATTGAATATGCCATTTACCTTGTCTTTTGTATTCACAACATGTTTCTTTTCAACAAATTTATTA 

CTCATATTACGCCAAAATCTGTAATAGTTCAGCAGCGAATCTTCATCATTGATCTCCTTATCAAGCAAAT 

CCGGGTGTTTCTCGTGCACAATTGTTAGAAGAGACTCTATCTGCAACCTTGTAGCTGTACTGTTCAGTTC 

CCAATCGTCTATTATTTCAGTATACGATTTTGGTGAATTTTCTTTAATCAATCCATAAAACTCTGTAAAA 

TATTGAAAAGTATCAGTTAGCTTTTTAAACGTCTCCAATTGTTGACATAATATCATCTTGGTAATATTTT 

CAACAAACTCATCAAGAAATGAAACTATGTTAGGCAATAATTCAATACACTTTTTATTCAAGCTGTTGAA 

CGCAGCATCAACTGTCTGATATGTTGTTTCTAATTTCTCAAGTTTGTCATTATCTTTCTCGTCCAATGGA 

ATCGCTTTCTGGTTCAATTTCTCAATTTTGCGATGCAAATGATCCTGTTCTGTTCGTTTCATATTACGCT 

TTTTAATCAATTTCAAAGTTTTCTTCAAGTATTTCTTCATTTCGTCAATTCTATATTTGAGAGATTCGTC 

ATATGCTTCCCAATTATTTTCCAAATCAAATTTTAAGTTCTCCACCGTGATCAAATAATTATTCAACTCT 

TCATTTATAGATTCATTCAAAAATTGCATCTCCTTTGGGTGTACATGTGGGATTTCTTGTGTTGCTTGCC 

ATGAATCAAATTCTTGGTAATACTCGTTGATTTTATCAAAACGCAAAGAGTCTTGACCAATCAAGTTGAT 

AAATCCTTTAATAATTTTAATATTCAGGCCGAGCACATGTGGCAAGAAACTCTTGGACAAATGGTGATTC 

TGCGATGTGATGTACTTCAAACCAGAAACTGATTGTTTGATATCGTGATAATAAATCTCAACAAGTTCAT 

CATCCTTATCGTAATCTCTGGTGTGGAATGTAACTGTGTCTTCAATGTTGTAGGATATATTTTTGAATTC 

TGATTCAGTGTACTTGTACCCGTCCTTAATATGAGTTCCAATATTAGACGATATCAGAACAATATTATTT 

TTCAATTGATCCACAACCATCGTTGTCTTTTATCTATCAGTAGTAAATTGAAAGGTGGGGGGATAGAAAA 

TGAACTAGAAAAAGAAAGTGATGATTCTAAAAAAAAAATTTCTCAAATACAAATACTAAGATAAGTGTTG 

ATTATATGACAACAGGGTTGGAAAGTCAATTATTAATTAAGGACCATTGTAGTTAAGCTGCGCATAGAAG 

CAGAAATGTGTGCAAGAACAGGAACGGACGGGAAAAATAATAAGCTATTTGAATTAACACGAAATAACGT 

GACCTAAATTAAAATAAGAATAAGGAAAAAAAAAAAAGATAGGCTTTGAATTAATGGTTTAGTCACTTTT 

GAACTGATAATTGTTGATCTTGAACTAGTAATGATTAGTTTAAAAACCCAACAGGAACACTTAGTTTGGA 

AAATATGAGTCTCCATAGATCTTCTCTTTAACTTATGCACGGAGCTTAAAAGTACAGTTAGACTCAAAAA 

CGAATATTTTAGTGCAATCTCTACAGTATTGGGGTCTGCTCACAATCAAGAAGAATAACCATTTAAAGGC 

GCTCTGTTGTAGAAATTGTTTGTCTCTACAAACGACCACGATTAGTAAGAGAGGGGAGGAAAGACAAGAA 

AAAAGGGGGTAATCATGATAATTGCTAAAAAGTTGAATTTTTGTAAAGTCCACCCGAGAGTTGGTAGCTT 

TTTAGATTCTAGATCTAACAGCAGTTCTCTGTACCGTGTCAAAATATCAATTGTGGATCCAATACAGCTA 

TTGTAGTGGTACTTACTGATGACGATCCTGCATATTTCGTCATAATTCACACATTCTTAAAATTATTCAC 

ACATCCTTGAAATGTGTTAATATTCCCAACATTATCAATTATATGTGTTCAGAATTGGTTGCAAAGTTAT 

CAACTCAATTCACGCTATATAAACCTTACAATTTCTCTACATTTTTATATTTTTTTATATTGGCTTTTCT 

TTTAGAATCAATCAATACTTTTTTTATCATTTAGATACATCTTTCATCTATTAATAGATTATCTTTCTAT 

ATATCAAAACACGACACAGTCACGTGCCAAAAAGGATATAAGAAGGAACTTCAACCTGTTCTTTTCTTTT 

TTATTTTTAAATTTGATTATTATTAATTTTTTTTTCCTTTCTTTCCTTACCAATTTTTCTTTGCTTGACT 

TATTCAAAAGGTGAAACAGGGATTTTCCAATTCACATAGCCAAAAGTATTTTTGGTTTCCACATTCCTTC 

AAAACAATATTTGTGCTACCTCCCCCTTCCCACCAAAAGTATCCGATTCCAACCATAAAGCAGC 

>retrotransposon_18 791bp Incyte : 1..791; Tca3-like LTR: 277.. 590 

AATAATGTCAATTTATTACCAAGTTTCCAAAGTTGTCTTGTTGGTAGATTATATTGTTTACAGATTATGG 
TACGTTATAAAGGTACTAATAATGATCAAAATGAATTTGCTGATAATATAGTTAAACTAGATGTACCAAT 
ATTAGTAGGATAAATAAAGAATCAATAACCATGGCACGTGAATATGAAAAGGTAGGGGCTAATATAAGTG 
TAAGTGTAGTGTATAAATTACAAAACAAAAAAGGCTGTTGTTATTAAGATGAGTCAACTGTGTAAGTGAC 
GATCCTGCATATTTCGTCATAATTCACACATTCTTAAAATTATTCACACATCCTTGAAATGTGTTAATAT 
TCCCAACATTATCAATTATATGTGTTCAGAATTGGTTGCAAAGTTATCAACTCAATTCACGCTATATAAA 
CCTTACAATTTCTCTACATTTTTATATTTTTTTATATTGGCTTTTCTTTTAGAATCAATCAATACTTTTT 
TTATCATTTAGATACATCTTTCATCTATTAATAGATTATCTTTCTATATATCAAAACACGACACAGTCAC 



GTGCCAAAAAGGATATAAGAAGGAACTTCATCTTGATTGCGCCGCAAGCAACAAACAATAAGCCAAGGAA 

AGTATATACTCCAGATCTACTATGAGTATGACACAGCTTATTAATGATCAAGTCTACAACTTCTACTACT 

AAACACGTTCTTAACAAATCAAACAGTATTCAATTGTTTTAAAAAACACTATACAAAATTAATCAATAAA 
AAACAACTAAAGCTAATTCTA 

>retrotransposon_19 4581bp Incyte : 1..4581; Tca3-like LTR: 2725.. 3037 

TGGGAATTATTAGAGGATTCTTTTTCAGTGGATATATAAATAACGAATAAATTCCTTGTTTAATTATTTT 

AAGGGAAGAAAAAAAAAATAATCAAACAACCAACCCTCTTTATAATTAACAAGACTACAACTTAATAAAA 

ATGGGATATCCACCAAATTTCAAAATTGTTACTAAATCATTAACAGAAAACATTTTATTAGCATCAACGG 

CTTTTTCAAGAGTTGATAAATTCAATTTTGGTGCTCGTATGGCGGTATTTAAATTTCCTCAATCAAATAA 

AATCATTTTATGGTCACCATTACCTTATACACCACAAGTAATTGATGTTTTGACAAAATTTACCAATAAT 

ACCAATGAATCAAATTTAAATATTGCTTATGTGATAATTCCTGATCGTGAACATAATTTAGCTGCTAAAT 

CATATAAAGAAAAATTTCCCGGGTGTAAATTAATTGGAATGGAAGGATTAGATGAAAATTCATTGAAATT 

GGATTATAAATTTATAAAACTGATGGGTAATAAAGTTTTAAAAAATGATGAATTAAAACAAATCTTTAAT 

GACAGTGACAGTGGCTTGATTGTTGATAATTTTGAATTTGTTTATTTACCAAATCATGCAAATCAAGAAT 

TGGTTGTATTTGATAAATCATCATCAACATTATTTGAAGCCGATTTATTATTCAATTTAGGTGTACCGGG 

GTCAACTCTGGGTGAAACCATTTTAGAACAATATTCACCAGAGTTGGGGTTCCCTAAAGGGTTTAATCCT 

CATTCTGGTTGGTCATTTATAACTAGATATTTACAACCATATTCTAAAGTTGGTCGTTTCTTATTTAGAA 

AAATTGTTGATATAAATCATAGTAAACCTGGATTAGAAGCTATTTATAATTCATGGGATTTTAAAACTAT 

TGTTATGTGTCATGGAAATATTATAACTAAAGATGCTAAAGAAGCATTTAAACATGTTTTTGTATAAAAG 

TAAAAGAATTGAAGAAGATAGTCAAATAGTAATAATCAGAATATATGTATGTTTTTTTTTGAAGAAAATT 

AAAGAATATATTCACGAAATAATAATAATAAAAATAAAAAGACTAACTATTTTGAATAGAAAAAAAAGGT 

GGCACTATTTCAATGAGATAAACCAATTGTGAATATACGTAGATGCCTTGCAGCAGACAATATAACCAAA 

TGTTGAACAATATGTGGGATAAATAGCATTTTCATCTGTGCCATTGATATTGCATTTATATCCTATTGTT 

GAACAGTGACAGCACCTGTGGCGGTGGCTATTACATAACAGAACAAGTGGAACAGCAGTTACCAGTCAGA 

ACAGATCTAACAGCATTGTTTTTAGCAGCAGCATCTTTATCTTTGGTTTGACCAGATCCAGTTTTTTTAG 

ATTGTTGTTGAGCAGCCATTTTTTATTTGAATTTGTTGATTGAGTTAATATAGTTTATAAGAATTGAGAG 

TTACTTGTTTGAGTTGTTGATTAAGAATAGATTAAACAAAAATATACAAGAGAATCTGTAGACATATTTA 

TACTCATGAATTTATATATATATCTATGCTTATATTCATTTGATGTATAAATTGACATGATTATGAACTG 

CAAGAGGTTTGATTTTGATTTGTCTGCAAAAAAAATATGCTCTATTTTTCGCAATTACCCCCCAACCCCC 

CCCTCACAAAGTTCCGAGTTTAGTTGGAAAAATGTTTCGATAGAGTAAAATTTCAGGAACAAAATTGACT 

AATTGGGAGATGACAATGAGAAACAGTTTTGAGACTTGATCATACTTCCCCATACGCTCACCTCTTTACG 

TTAAATATAGCTCTTTACGTTCTCTACAATAATTTTTTTGACTTATTGATATTTCTTAAAATGGTTACAT 

GAAATAAAACAAAGAGATTCATAGGAATATTACTTTTTCAGGTAGACACAATGCAGCTAAGGTTGGATTT 

CTCAGGAAATATCATTCAAGCTTTATCTGTTAGTTAGTGCTGTTATTTATTACTGGTGAACTACACCAAA 

GCATACTGAAGGCATTTTACGAGGTTTTTGAAAGCTCTTACTATGTAGCAACTCATCTAGTACTTAGTAG 

AGGAAGTGCATCAAGTATGGATCAACCAAGTGTTACCTTATATCATTGGTTTAAACATTGTAAGACTCAG 

TTCGAAAAAAAAATTAAGGTTTCTACTTACCACTTTCATGTGGCTTAAAGTTGTGGATGTGATATTGAAT 

ATGTTTCAGATTTGTCATGAAACAATAAGAACAATAATAAAGAAGAAATCAAATCAATCTTCAATGTATG 

TATGTTTCTGTATGGCGCATGTGGGTTCTTTGTTTTAAAAAAAAAACTTTAAATTGAGTTTGTTTTTTCT 

TTCTTTGTTAGTCAATCAAACTTTAAAAAAGAAGAACAAGTAGAAATAGTATAGTAAATTGATATAGATA 

CTTTTATTACTAATAACAAATCTTTAATGGAATTTATCTGAAATTAATTGTCAAGTTTTAATTCAGTAAT 

GATTGATATTACTCTAAAACAAATGCTGTGTGGGGTTGTTTTGTTTGACCTGAAGTGTCCAAGCTTTCCT 

GCTTCATGATCTAACTCTTTGTACTGCTACACCTACATTGGGAAATATTGACCTTATAGTAACACTTACT 

TTCTTTTATTAATTGTCTAAACTATGCTTTTGATCAATTCACACGTACTTCATTTCTTCTCCCCTGACGA 

TCCTGCATATTTCGTCATAATTCACACATTCTTAAAATTATGCACACATCCTTGAAATGTGTTAATATTC 

CCAACATTATCAATTATATGTGTTCAGAATTGGTTGCAAAGTTATCAACTCAATTCACGCTATATAAACC 

TTACAATTTCTCTACATTTTTATATTTTTTTATATTGGCTTTCTTTTAGAATCAATCAATACTTTTTTTA 

TCATTTAGATACATCTTTCATCTATTAATAGATTATCTTTCTATATATCAAAACACGACACAGTCACGTG 

CCAAAAAGGATATAAGAAGGAACTTCACCCCCTTGCTCTTCTTATTATTGTGTGTGGTGTAATAGTTTAT 

GGTGTGGTGTATGATTGCGTGTGTGGGTGCAAAAAAAAGGTGAAGAAAAAAATACCTCAAAATAAAAACA 

ACTTCAAACATTCCCCTCATTTTCTTTCACAGTCATTTGGTTTCAATCTCTATTGGTCTTCTTTAATCAT 

CACTATTTATTCCAGTTTATAAGTCGAAAAAAGTTAGTTCATTGTTCAATTGGGTTTATTTATATTTAAT 

ACTATGCACTTGTTCTTCCTTGACTAACTCACATGAGAAAGAGAGAGTGAGGAGAGGGTGAATCTATTCT 

TTCTATTGATTATGCATAATTTTCAATCAGGTGATAAATAACATTATCGATTGTTCTGTGTATACGTTTG 



CATATCTTTCTTATCTATCTTCATAGTAAGAGAGAGATTAGATATCATGATATTGAATAGAGCGTGTAAT 

TATCAATTCACTATCATTGTAGAACCACCCTCAGTTGATCTTGTAATTGAAAGTTACAGATGAGTTGATT 

ATGCGTATAGGAAAGTATTGAAGTAAATAAAGTCCGTGTGTATTATCTCTTTTTCTCCGCATTTTATTGC 

TTTATCATTCATCATCTCTTTTCTTTTCTTTTTATTCTTCCTTTAATACAATAGTGGTCAAGGGGGGGAG 

GAGGAAGAAATTGCAATCTATAGTAACATTGATGTTCCCCTCTTTCTGATTAGTAATCCCCCTTTCACTA 

TTAGCAACAATAAACTATATATATATGTATATCAAACCTACCTTCCTTCCGGTCTTCATTTTTGTTCTCT 

TTTCGTTGACTAGAACTTTCTTAACAAACTTCAAAACTATCATGCCCGATTTATTTGATAATATTTTTAA 

TAAAATTGGTACAAAATTCACTGGTGGCAAAACCACTCATCATTATGGTGGTGCATCTCAAGTAAATACC 

GGGAAATGGTATAGTTATACCAGTAGTGCCAGTAATAATAATTATTGGTTACCTCGAGAAAGTCAAACAA 

AGACACCAGGTACTCAAGCAGAAGAACCAGAAACAGTTCAATTTAAAGTGGATCGATCAATGAGTGTTGG 

ATCAATTACTGAAGATTCTGGTGCTGCTGGTGCTGGCGGTGATCGATCAAGAATGAATAGTATTACTGAA 

TAATTGTATATACAACGTATATAAATAGGCTGGTCTTATTATTATTGCTTTTAATTTAGTATCTTTTGAA 

AGATAAATTGGTTAGTGACGTTTTTTTTTTTAATAAATTTGTTTCTATATTAATATAAAATTCAGTTATT 

ATTATTAATAGTAATCCAATTGTAATTATTTATAATGATATATATAAATATATTTAATATACAGTTTGTT 

ATTATTATTCTTTAGTTTTGCTTTAAAATTTATTTTACTTTACTTTACTTTATATGATATTATATCTGTA 

TTAATGACGAACTGAAATTGGTGAAATCGGCATTAGATTATGGACTGAGGATAAAACAGTTGAATAAGGG 
GGAGGAGGTTTGATGTGGTGGTGTCATATCA 

>retrotransposon_20 5325bp Incyte: 1 2386/3779 .. 4807, public: 
2387. .3778/4808. .5325 

AATGGGTTTATACAATCAAGGACACCGGTCGCTACAAGGCTCGCCTTGTGGCACTTGGTTATCGACAACA 

GGCTGGTGTGGACTTTCTCGAAACGTATGCTCCCGTGATTCGTGGAGAATCAATCAAACTAATCTTTGCA 

CTCGCGTCAAAATCCAAACTAAAGATTCATTCCATAGATGTTACCACAGCTTTCCTCAACGGGGAAATAC 

TGGAACTCATATTTGTGAAACAACCTCCGGGATATGAAGATAAGAAGCGTCCTAATCATGTTTGTAAGCT 

CAATCGCAGCTTATATGGGCTTAAGCAGCTGCCACTAATGTGGAACATTAAATTAAATGATGTACTTATA 

AAGGAAGGTTTCCGTCGACTTGGTGGTGACTTAGGGATATACATTAGTAAGGACAAAAGAACAATAATGG 

GAGTTTATGTTGACGACATTCTCATTTGTGGACCTTCTGACAGTGAAATTGAACAAGTAAAGAACAACGT 

GAGAAAATACTTCTCAATAACTGATAATGGATTATGCCGAAAATTCCTTGGAATTAACGTCTATCAACAA 

GCAAATGAAATAAGATTAAGTTTGAATGATTATATAAGGAGAATGATTGAGGAGTTAAAATTATCTGTCT 

CAGAAACAAACCCAGTATCTATACCATCTGATGTCAATTATGAAATATTTAAAGTTAACGAAAATGATGA 

TGAGAAACCATGTGATCAAACCAAATACCGAAGTTTGATAGGCAAGCTCTTGTTTGCCAGTAATACTATA 

AGGTTTGACATCGCCTATTCTGTCAACTCCCTATCCAGGTTTATCAACGATCCCAAAGAAAAACATTGGA 

TTGCAGCTGTCAAGGTGGTAAAATATCTCAGTGGTACTCAACGGTATGGTATTTGTTATAACGGTAACGG 

TGACTTGAATATTTACGCTGATAGTGATTGGGCTTCCACTCCATCTGATCGAAAGTCTATTACGGGGTAC 

ATTGTTACCTATGCTGGAGCGCCGATAAGTTGGCGTTCCAAGAAGCAGAACGTGATAGCCTTGAGTACGA 

CAGAAGCGGAGTTTATGGCTCTCACAGAGTCCATAAAGGAAGCCCTTTGGCTAATATACATTTTTCGAGA 

TATTAATGTGATATTGAAATTACCAATTGTGATATATGAAGACAACCTACTGTGTCAGAAATTACTTGAA 

AATCCTCGATTCCATAATAGGACAAAACACATTGACTTGAAATATAAATTTACCAAAGACCATATAGAAG 

CTGGTACAATCAAAGTGGAATCAACTAATTCAGCAGATAACTTAGCCGACATGCTAACTAAACCTTTACC 

AAAAATTAAATTTAAACATTTAAGATGGCTAGCAGGATTAAGACCTTTAGATTGATTAGATAATGATAAA 

ATGAAATAAAGATTAATTTGGAGATGCAGGTTGATGGGGAGGATGTTGGAAAAATGAAATATGATCAATC 

CTGCATCTAGAACCTGTGGCAGAATGAAACCTACGAGATTATGAATGACTTGTGAATACAAGTTGAATGT 

TACAGAATGTTACCAAGAAGGTTACACTTGAATATATGAATGACTAGAAAGTGAATTGAATGTTACAGAA 

CCTGAATAACAATGTTACACGAATGTGTGAATGATATGAGTTTATCTATAGTAATGTGACATATACACAA 

AGGTGTGAATGACCGAGAAAACAGATGTTACATTACGGGCACTGGAGAGTGCAAGTCTAAAGAATCTTGG 

AGTAGAAATAAGTAATATAAAAAGGACCAAAGATTCTTTAGAGAAAAGTAAATGAAACTATATTAGATTT 

TATATAACTAACTAACAAATAAATAAAAAATATAATATGTCTACAATGCCACCAACTTCCAAACGTACTA 

GAAAGAGAACTAGAACCGATGATAATGCTGAACCAACTATTCAAGATCCTTCACCGCCACTTGCTAATGT 

TGAACCCACAATTCAAGAGACTCCACCGCTGGTTGAAGTTAGTGATGAGACTAATTCAACTGAAATCAAT 

GAGACAAATAGTAATACTCATGAAGAAACAAATGTATTAACTAATGTGCACTCCTCTCCAATCGAGACAG 

TTACTGAGAGGAACTTCAATTTTCAACAGGTTATTGCCTCTATCTCCACTGTGGACAATCAAAGTCTCTT 

GAAGGATAAAATTTCTTATGATCATTGGTTCAGTACCTTGAAAGAAAATGCAATCATGATTAGTCCAGAT 

TTTCTTGACTTTATTAACAAAGACACCATGGATCTCCAACAGTACCCAACTGTCTACCAAACATTCTTAG 

ATCGTCTTATTTGTGCCACAATTGACCCACATATCAAACAATCTTTAAAATATCGGAAGTTATCAGGAAA 

GAAAATGCTTAGTGAAATTATCTCTCAATTTGGTTCTATGACTATTAAAGACAAGGTTAACTACTCCATA 



ATTATGGCTACCAAAATTCATTCTGATGTCACCACTCATTTAGACAAAATGAATTTACTGGCTCAATTTT 

ACGCATTTCTTATGCGTCAACCTCAGGACCTTAAACCTGCCCTTTTACTTATTGCGGGTATCAATGACTC 

ACGTTTCAATGAAACATACTTTCACGATAACAAAGAATTAACGATCTCTAAGTTGGAACGGTATATCATT 

AATCAAAACTCCAAAATTACTCCGTCGGTACCAACACCTTCTCCACGTGACGCTGTTACGGGTTTACTGG 

TTACCCAGCCTACGTCCGCTCTGGGACAAAGTGAAGTGTTTAATACACAATGTTTTAATTGCTTTGGGTT 

GGGCCACACTGCACGTCGCTGTGCCTCTCCGAAACGTCTTGGCCAAATAAACAACCTTAGATCTAAATTA 

CTTGCGTTTGAAACTCGATCCAAATCCAGAAAGCGTTTTCCACCTCAACCTCCTCCTACGAATCGGTCGG 

CAAACTCAACAATAATAACTAATCCCTCACCTACTGACGATACCATCTCGTCCACCACTGAAGATTCTTT 

TCCACGGGACGTCTTTGGATGGGCGGCATCATCTGACCAAATCAAATCAAAGGACAACCTTTCTTTATTT 

TTTGACACAGGTGCCTCGGCACATCTTATCAATAATCTCAATCTACTTCATGATTACAAACCCTCTAAAG 

AAAACAAACATGTGATCACTGCGAACGGTGATAAAATTCCTATCTTAGGAACTGGAACTGTGAAACTCCA 

ACATGGTCAACACAAGATATCACTTCGCAATTGCCAATATTCTCCACATCTACACATCAATCTTATCTCA 

CCCAGACTCTTACTTGATGATTCCACTAGCATGACTATCACCCAATCCGGGATTTATCACTCCAAAATTG 

GACAAATTGGGTATTATTCGACTGAAGATGGTAATCTAATCAAGTGTATGTTCCGTCCCATTACCATTCC 

TCATCTTTCGTTATATTCTCAATATGTCGAAATGGGTCTTCAATCTAACAATGTACTACGTAACATTCCA 

GCTTTCACGGTCCATATTCCTCAACTACATGACTCCCTTGGACACACATCTACTCAACAAGTTTCAAATG 

TCATGAAACGTTTCAATGTCACTACTGACAACATTGGTACGGACTGCGAAACTTGTCGGCTTGGAAAAGC 

CATTACTCAGATTCCCAAGATCTCAACCCATACCATCTCTAGTCATTGCTTAGAACTACTTCACGTTGAT 

GTTCATGGACCAATATCCGTTCCTAGTATATTTCAAGAACGTTATTTTCTTGTGATCCTTGATGACTACT 

CAAAATACTTGACAGTTCAACCACTATGCAACAAATCTGATGCTACTGCCGAAATTATCGAATTCATCAA 

TCATTGGGAAAAGTTCTTTCTGGGAAATGGCAATTACCATACGAAAATTCTCCGGTCGGATAATGGAGGG 

GAATTCTTAAACAAAACATTGACTACCTATCTTGATTCAAAATATATTACTCACCAAACCTCCAATGCCT 

ATGAACATCATGAGAATGGCGCTGCAGAACGAGCTATTAGATCGGTTAAAGACATGGCTCGAGTAATATT 

GCTTCAATCCAAATTACCAGTGCCGTTTTGGTCCCTAGCAACCCGATGTGCTGCGTTTGTTATGAATCGT 

CTTCCTCATAAAACAATAAATGGTAAGATTCCTTATGAAGTATGGACTAAACAACTTGTCAATCTCAAAA 

TGATGAAACCGTTTGGCTCTCAAGTATATGTGAAAATTCCTATTGGAGTCAAAAGTTTTTCTGCACAAGC 

ACTTTCTGGAATCATGGTGGGATATGCCACTAATAAGAAAGGCTACCTTGTATATGATCCCACACAAAAT 

CGAATATTCACATCCTCACAAATAATATGTCATCCGAGCATTTATCCAGCAGCCAACCTTACGTTTAACG 

AACCCTTAATTATCTCATCGAAAGTCACGGCTGCTCATCTTCACCCCCTTACCATTTCCAATTTAGTTAT 

TCCACCTACCAATGCTGTATCTGAGACACCTCTGCAAATTGTGTGCTCTCCTCAAATTCGTCAGTATGTC 

CCAAAGTTTGCCAATTACAAACTGTCTTGGAACATGGGGAGGATAAAATATATGCACTGATTATACCAAT 

ATCGATCGGCAATATGAAACGCACAAGAACAAATGAAAACAAAATATGCCAGCTAGATGAATCGAACAAT 

ACCACCATACCAGATAGTGTAATTTTATCGGCTAACAATGTGTTATTAAACTTAGAATCGAGATCTTCCA 

TTCCCAAAAGTTATAAGGAAGCTATAACATCTAATGAAAAATCCAAATGGGCTGATGCTATGGATAGCGA 

GTTTAATTCATTACAATCCAACAACACGTGGTCACTTGAACCACTACCGGAGGGACGCAAAGCTATTGGT 

GTCAAATGGGTTTATACAATCAAGGACACCGGTCGCTACAAGGCTCGCCTTGTGGCACTTGGTTATCGAC 

AACAGGCTGGTGTGGACTTTCTCGAAACGTATGCTCCCGTGATTCGTGGAGAATCAATCAAACTAATCTT 

TGCACTCGCGTCAAAATCCAAACTAAAGATTCATTCCATAGATGTTACCACAGCTTTCCTCAACGGGGAA 

ATACTGGAACTCATATTTGTGACACAACCCTCCGGGATATGAAGATAAGAAGCGTCCTAATCATGTTTGT 

AAGCTCAATCGCAGCTTATATGGGCTTAAGCAGCTGCCACTAATGTGGAACATTAAATTAAATGATGTAC 

TTATAAAGGAAGGTTCCGTCGACTTGGTGGTGACTTAGGGATATACATTAGTAAGGACAAAAGAACAATA 
ATGGG 

>retrotransposon_21 2027bp public: 1..624, Incyte: 625.. 2027; zeta-like LTR 
1384. .1891 

TTTGTTTGATAAAGAAAATAAAAAAAAGAAACAAGGGTAGTAAATGAGTACAGTAGCCCTGTTGAACAAA 
GTCTGCGATAACTTAATTATGGGTGAACTCAAGGGGACAGTGTCTTTGTCTATCATCCGATCCTTAATCA 
AGTCTATTACTGAATATCAATTATTTGGACACCTGTTTATAAATTACTATCCAATCTATGTTCTTTCAAT 
TCTTTCCTTCAATATTTTGCCAGCCAATAAGACCAAACATAATCCAAATATACATACCAGTGAATTCTAA 
ATTGTTTGGTGAAACATCCATTTTTGATCTATTTCAAATTGTATTTTCTTTTAGTAGTAGTAGTAGTAGC 
AGTAATTGATTAATTATTATCAATATCCGAAATGATGATAAGAATAATAATTATATATATAAGAAAGAGA 
AAAAGAGAAAAGAAGAAGAAGAAGTATAAAAGAAGTTGTTATGGGTTTAATTAAAAAAGAAAAAATTCAA 
TGAAATTTGTGTTGTGTTGTGTTGGGTTTGAATTTCTGTATAACTCAATTTGGAGATTTTTTTTTTTTTT 
TTTTTTTGAAATTTTTATTAGTCGTGTACATTGTTACAATTGTTTCTCGTTCCCCTTTTTTTTTTCCTTT 
CTTTGTTTTGTTTTGTTTACCTTGTGATAATTTTATACGTGTTGAGAGGGCTCTCGTCGTGCCCGTGTCC 
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GTTTCCGTGTCCTGTTGGGTCCCCTCCGCCCATGCCGCACCGCACCGTACGGTAATGATATCTGATTGTT 

GGAGCGTTCTTCGCTAACAGGTTCTTTATTTTTGTTCGGGGGTTTCGAAAGATAATGTAGAAACACCAGG 

GCTTATAACTGAGAGTTAGAGTAGTGGAGATTAGTAGTAGTAGTACAATCCTATAGCCCAAACATTATTG 

GAGAGATCTTACCAAATAGCAATCATCATGATGTATTTACTACTACATAAAGAATTTAAGACGATATTTA 

CCAGCAATAAACAACATGACCAACTAATTAACAAACATTTGAAAAACATAAAGTAATTAGAAAGTTTAAA 

AAGTGTACAACCAGTGTGGAAAAAGAATGGAATTGGAATTGAACAAAGTTATTAATTACTGAAAAAGGAA 

ATTTAATTTCTTGAAAGGCAAATCTTTGTTTGTTTTTTTTTTTGGGTCTTTTCTTTCATTTAATAAGCGT 

GGGGTATTAATAGATAATGATATTGTTGTTGTTATTGTGATATTGTTGTGAAATTTGACATATGATAAGA 

TAAGTTTCTTTCTTTTCTTTCAACTAGTATAATTGAACTAAAGACCACCACCACCACCACCACATAGTTA 

GCAACCTGATATGCTGTTCATGTAACAGTAAATTATCTTGGTACTATACCACTTGTTGTAATATAGCTAA 

TGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAG 

TTATTGTTAATACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTA6GTTGAGTTAA 

TTGATTAGTGAAAACCAACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAA 

ACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACCA 

CTAGAAATCTATTGATGGTTTCATATATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTGCT 

AGTATATTTGAAAGCACTACAGTATAGTATGTCAGAATCAGATCATTTAAACTCTACTAATAATACAGGA 

AACACTTTCATTAGTCTAGATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGCTAACCCACAAC 

AATGATAATTCATCTTTTTTGTCAAGACGATAGGTTAATGTTACAAGCACTTTATTGGGCTCGAAATAGT 

GGTAAATAAGTCCATAGATATGACCTGTTACAAGTTATTTCGATGATCAAGCCGGCTCTGTGATTAC 
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TTTTTTTAAAGAATTAATTAAATATGATGGATGATAGAAATTAAAGGAAAAAGAAGAAGAACAAAACAAA 

AGTTTAATTGAAAAAAAAGGGAGAAATGAATATTGAATTATTCAGCTTTTATATTGCTGATAGATGTTGA 

AAAAAAAAACGGAAGAATGGGGATAGCAAAACTGTGGGTGAGATTAACTCATCTATGGCGCTAAAAGTCT 

^TTTTTTTTCTCTTTTATTAGGGGGCACATAAATTATTCTTTTCATTGATAATCTCGAGTCCGTTTTTAG 

TTCATTATTCGGAATATATTACCGTATTGGGAACGATAATTATTATTAGTTCTCCCCGATGGTTCGATTT 

TGCTGGTGCAAAAATATAAATCCGATATTACTTTATTGGTGTTTTAATAAATCCGTTTTAAAAGTTCGTA 

GACATATACAGGATGATAATAATTTAACCGATTTATAAGTTGGAATCATTTGGATGAATCCGCTTGGGGA 

GACGTTTTCCAATTTTAGAAGTTTAACTATCAATTTTATGTGACATCCGAGTGTACACATTTTGTGAATT 

TGATCTTATCAACTCACTTGGTGTACCATGGCATTTATAACAACACTTTTTAGAATCGGCTGAGTTACAT 

GCATTTCCTCTATTTGTAGATTAATGGAAATTCATAAAATCGTTCACATTTTTTTCTATAATGAGTACCA 

TTCTGTTTCCATAAGTAGGGGACTAAAAAATAATTGATATCTCTAATCAGTGACAGCTCTAGTCAACTTG 

ACCGTAATGTTTTGACGACCATTATATTTCTTGTTTGAACTATTGATTTATGAGTGTTGTCGTAACAAAA 

GATCAATTCCCGTCAAAACGCATTTGGCACTTAATCTTTGATTGAACCGATTTTGATCTCAAAACATAGT 

ACCAAGGTCAATTATGTTCGCTAATGAAAGAAAGCTGTGACGAAAACCTCAAATTCATGAAGAAAGAATT 

ACTGTTGTGGAAAATAAAAAAGTCTTTCTTCTGATACTTTACAAGTCCCTCAACCACAAATACAAAAATG 

AAAGTTACCCATCGATCTTTTTCATTGGTTAAGAATTAATACGAGAATATCAAATTATCTTAGAGAGGGT 

CTCACAGAGCAACTTTCTGAGGCACACGGTCACCAACATGATTTGTTATAAAAAATTCAACCAAATTTTG 

GAAAAAATGAAAACAAAACAAAACAAAATCTGAAACATCCCGAAAGTCACAAATGCTTGATTACTTAAAA 

TTACTTATTTGCTTCAAGACGCTATTATTATTATTATGACATAATACTACTTGAATAACAGTGAACTGTA 

ATTGTATTAAGAACAAATCATAACAAAGGAAGATGATGACGATGATGATGACCCCTTGAAATATCCAGGG 

CACATGCATTGTGATGATTGTTGTAATATAGCTAATGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAG 

GTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATTGTTAATACAGTTATTGCTGTTGACTACTAT 

TGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTGAAAACCAACTAACTACCGTATTAAA 

TTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTA 

TAAATATGTGTAAAAATCCCCTTTAGAGACTAATCACTAGAAATCTATTGATGGTTTCATATATAGAGAT 

TAACGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTATAGTATGTCA 

GAATCAGATCATTTAAACTCTACTAATAATACAGGAAACACTTTCATTAGTCTAGATCAAGCCAGTACAA 

TAATGGCAGATCAAACTCAAGGAGCTAACCCACAACAATTACCATATTATATGAAGAAGACTATAACAAA 

ACTGTAGATAGTAGGGGATTGGTTATTTCCGGGGAGTAGAAGTATTGGGTTATCTAAGTCAATCTTTAAC 

AACCAACAATCAACAACAACCAACAACGTTTTTCCTATTCTCGGAGATAACTTGATTAACTTAAAAATTT 
TCTTGTCAAAAAATTTCT 
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TAATTCGCGTATGAATGAGATTGATGCCACTGTTGGTGCTGAAGTTTTAAAAAGAAAACAAATGGAAGAT 

ATGCAAAACAATAATAGTAATAATGGAGGGAAAAGATTTAAATCAGATCCAGTTTCTGATCAAGAAATAT i ^ 



TAGATGCTTGGGAAAATAATCAATTGGATAGGTTTTCAGTGGATCAATTGAAGGCATTTAGAAGAAAATA 

TCCTGATGTCAAATCAGCTAATAAGAAAGCTGACTTGATTGAAAATATCAGTGAGTTTATAAGGACTCAT 

AGAAAATGAGTTAATATGTAATAGTGATATGTTTATAGCTCTGTAAATACATGTAAATTTTTTGGTTGCC 

AATGAATTGATTGAGACTGAAAATCGTTTGTGGTTTGCCAATGAACATTAAACTTATTACTTGATCTAGA 

AGGCAGTTACTTGTTTAAAGAAGTGATGAGTCGTGATTAAGTAAAGTTTGCAGCACTAAATATTGTATGG 

TATTTGACTTAATTTTTTCTGCAAAAAAAATTACAAATTTTTAATGAAAAAACAAAACACAAGATAATAA 

CATTATAGAATAAAGATTATAGGATCCTACCAACATAGTTCCATTGCTGATCAGGACGTTTAATAAAAGA 

GCTTCCCAACAGAGACATATCTTAATAATAACAGGCTATTTTCTGCCTTTAAAAAGCCATCTAGGCTCAA 

AAACCTCAAAATAATTCATCTCCCACCTTGGCAGCAGAGTAGCCATAACACAGCCAAATCAATTTCTATA 

GTTTACATAATATATAAAAGGTTTCTAATAGCCAGTAAGCTTATAGAAATTACCCTTTTCAAGTGATTTG 

ATGAACAAATTATATTCTTGTACAAAATAGTATATTTAAAATTAAGAATTTGGCTTGCAAAAGAAACTCT 

CGGTAGCTTAGTTGGTAAAGCATTAGACTGTAACTGAGTTATTGTTTGCAAACAAACAATTGGAATGCGA 

TCTAAGGATCGGGTGTTCGACTCACTCCCGGGAGATTTTCTTTTTTACCACCACCATAGTTAACACGCTA 

CCATATGAGACAGAAATCTAGCATGAATGGCTTATATACAAGTGGACCATTTAGAAGCATGAGCTGTGTC 

CTAGTTTTTTATCATTTACAATTGAATTTCCCTCTGAAATTAAAATTCTAAGGTATTCATTTATCTCAAC 

TTTCTTAGATGCTGTTAGTGGGTTAAAACTTGGTAATGAACCACTGACGGAAGTTATTTTTGTGAGAATT 

AACTATAAATATATCAGCTTGGTTTTTTTTAACAACTTAGACAGCAATAACCAACACCCAACTAATTAAT 

CAACATTGTTATAAAGTTGTTTTCATCTGTCAAACCAGGCACATGGTAGCACATCAAAATCACTCTCGAT 

AGCTTAGTTGGTAAAGCATTAGACTGTAACTGTTCATTCTGGATATTGATATCTAAGGATCGGGTGTTCG 

ACTCACCCTCGGGAGAAATATTTTTTTTTTGCTTATAATTCCTTCAAATATTTACCTCCAGTATCGGTAT 

TGAATTAAATACAGAGAGCAATTGGAAAGGTTATTTTTTTTGTTATTTATTCCAAAAATTTCAGGACTCA 

AAGTTTAATAAGCCAAAGCCTATTTTGTACTGCGCTTCCCTTTAAAGCCCCTGCTAGCCCCTGGGCTTGT 

TGTTGTTGTTGTGTATGGAACAAGTTTATTAAATCCCATGACGACGATGATGTAATTGATTTTGAGAAAA 

AAAAGGATGAACAATGGAAAAAGGTACAATGGGTTATATACTTTGCCATGTGGTTGAAAATATGTTTAAC 

GGCTGTAGAACTTTTTTTTATTTTGTGTTAGTGAGTGAATTTCGCTACAATTGTTATTATACTCCACAAT 

TCAGATTTGTTGATAACGTTTAATTACTTAAATTTTAGTATGCATATTGATATATTTTTTCTATGAGATT 

GACGATTAATTATCGGTTTGTAAAATTCTATTGAAACACATTCACCAGTGCAACAATTAGACATTTTCTC 

AAAACCATGAATAGCTTGCAACTAAAACAAACAATAAGGCTGTACACTTTGCTGGCAATAAATCAGTGTC 

AAGTCAATATAAACAGTCTTAAGAACAATGAGAAACTCAAAAGTTAGGGTAGTTAGTTGATTACAAAAGA 

AAGAGACCACTTAGAGACAAAATAACAAGAAATGACATCACCATTGTAATAGATACATTTTCCAGTTATT 

CAAGCAATTGATTGAATGTATTCATAGCAAAATACATTTAAGACATACAAGCTTAAACATGGGTTATTCT 

CTAGTGGTGTTGTTGTTGCGATTCTAAGACTCCAATCTATGATTAATAATCGGATCACCATTTGCACATG 

AACTACATTAAGTACTAAAAAATATGCAATTCGCCTGTTTTCTTATTGATTAAATTTAACAATAAACTTG 

TCTTTAGCTTTGGCAAAAGCCTCCTTGAAAATCCTAACTAAGCACGTTGGAAGAGCAATGGAATTGTGGT 

TAGTTATAGAAAGCAAAACAATCTGAAATTGTAAAGTATTAGATGATGTGCAATGATATCAGAATAAAAT 

AGTTGCTGTTGAAAATTTTGTTCAAGACTCTTCACACAGCATAGCAAATAGTTATACATAAAGAGAAAAG 

TTCAACGTGCTTTGTTGCCCGTGTCTATTTGTTTTTTTAAAGCCGAATTCACCACTAGAGGGAGTATATA 

TGATTCAGAGTATCACCATCATCATCATCGAGCCCCCGTAAAAACTTACCAACTTTCGTCGACATTTCCG 

ATGAGAAACTTGATTTTTTTTTCCTTCCGTTGAAATAATGTCAGATAGCTCGCAAATATCGGAACGAGCA 

AATTCTTGGTCCAGCACCAATAATTCGGAAAATCACACTCAGTTAATATTTACTTACAAAATAAATTTAT 

TTGTAATTTAATGGCTATAAAATGGGAACGTAGTAAGAAAATCAACAGCTGTTGTAATATAGCTAATGCT 

AATTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTAT 

TGTTAATACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGA 

TTAGTGAAAACCAACTAACTACCGTATTAAATTAGTGTATTAAGATTGATTCCTATTAAGGATAAAACAG 

AGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAATCACTAG 

AAATCTATTGATGGTTTCATATATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTGCTAGTA 

TATTTGAAAGCACTACAGTATAGTATGTCAGAATCAGATCATTTAAACTCTACTAATAATACAGGAAACA 

CTTTCATTAGTCTAGATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGCTAACCCACAACAACA 

GCCTAGTCTTCTTGACACTAAAAAAAAAGAGATAAAAAACAATTTCAGCCAATCACATGTACTACATTTG 

TAATAGATTTTATTACTTCAGCTGCTTATTACACAAACAAGGTTGAATTGATATTGTGTAGAGTAAATTT 

TCGGAAATAGTTTGAATTGGGTGATCATTTTCTTTATTTTTTTTATGTCTTGTTTCTGTGAAGATCGGAA 

TGCCAGAGTGGAGCTCGTGAATTGCACCACTAATTGCAGCAGCACCATATTTCAAATAAAGTTTCTCATG 

TTGTAGTAAGGATTGCTTGTCTCCATGAAACCAATCACTTAACTAAGCCCCAGGCTAATTAGTGTGTCTT 

CAAACAGTTTTGTACTAGAGAAACTCAGACCTTCCCAGGGCAAGTAACAACCTAAAAAAATGCCACAAAA 



CTAAATGCAATTTCAGTTTGATATGATAGGCAATGACATCAACACCTGGAAAAAAAAAAAACTTTCAGGT 

GATGAAACGATTAAGGATTAAAGTTTGCAACGAAAAACAAGTGGAACTAAACTTTGCCTTATTGTTTTGT 

TCCGCTTACCTAATGATGTTTACTCCTTAGAACAAACAACATCAACTACTTTTAATCCTGACGACGAAGA 

AGAAGACCAAAAAGAATAATTAGCCGCAGCTACGGTGGTGGCACTAGTAGTAGTGCTAGTGCTTGTTGTG 

TCTCATCCAAGAGAAATGGAAAAACTGCAAAAATGCCGCAACTTTGAACATTTTGGAACACAATACAACT 

TTTTTTTTCCTTTTGGATTTACGATTAGCGCGATAGACGTGACCATAAAAATACCACACGATGTGTAGAT 

CCTCTAAAAATAATGTACACATTTCCAGGCTTTTGTTTACTGCTTAATAATTTGTCATCATCGGTAACAA 

TGATAGTCTCCCCACCCTAACTACAGTAGACGGAATTAGACACCAAAGATCTTATAAATCAACCCCAAAT 

TTTCCCATTTTGATTTTTGATTTTTTCGTATTCCTTGTTGTTTCCATAATTTTTTAGTTACTCCTCCTCA 

ACTAAACTAGATAACTCGTCACAGTTAACAACAGAAAGGTATGTTAAATATTTATTTCGTTCTAAATTCA 

AGTTTGGTATAGAATATTGCAAACAACAACAATCTGAAAAATGGACTTTAATTTGCTCTACAAAATGCAA 

ACACATCTAGAATTAATATTTGGTCTGGAAACCGTATACGGAAGTTATGGATAATCACGTTATCCTGATA 

TCTATTATTAACACCACCACAATATCTATTATTTCATGTATGGATTGCGGTGCCAAGATCAAAGAATCAT 

TTTAACCCGATATCTTACATTTCACCTCGATCTAAATGTGATTCAGTATCACCGGCTCATTGTTTCACCA 
CTCAACCTCCCCATACTGGGAGTACATAT 
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TGTTATAAAAAATTCAACCAAATTTTGGAAAAAATGAGAACAAAACAAAACAAAATCTGAAACATCCCGA 

AAGTCACAAATGCTTGATTACTTAAAATTACTTATTTGCTTCAAGACGCTATTATTATTATTATGACATA 

ATACTACTTGAATAACAGTGAACTGTAATTGTATTAAGAACAAATCATAACAAAGGAAGATGATGACGAT 

GATGATGACCCCTTGAAATATCCAGGGCACATGCATTGTGATGATTGTTGTAATATAGCTAATGCTAATT 

CTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATTGTT 

AATACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAG 

TGAAAACCAACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAG 

TGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACCACTAGAAAT 

CTATTGATGGTTTCATATATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATT 

TGAAAGCACTACAGTATAGTATGTCAGAATCAGATCATTTAAACTCTACTAATAATACAGGAAACACTTT 

CATTAGTCTAGATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGCTAACCCACAACAATGATAA 

TTCATCTTTTTTGTCAAGACGATAGTTAATGTTACAAGCACTTTATTGGGCTCGAAATAGTGGTAAATAG 

GTCCATAGATATGACCTGTTACAAGTTTATTTCGATGATCAAGCCGCCTCTGTGATTACGGCAATTATTT 

TACTATTGATAATGAGTAAAAGTTCACAACCAATAGAAGATATCCACCCAAGCAATTTCTCTCGACGAAC 

ATCTTTAGAATAGTTGGTATAATAACCTTACGAAACATTAATAAAGAAATTGTACCCGATCTTGTTTTCG 

AGTCAAAAACAAAGAAATCAAACCTAGAATCAACAATGTTCTAGCCATCATCTCCCGCCACCCAAGTGAT 

GTACCCCTATTTCTTGATTCTATTATTTTCTGACCCTGTGAGGGAACAAAGATACTATCTTTAATAAAGA 

AACAAAACCTCAACAACAACAACAACACACTAACACACTAAGAAACTAAAACTTGACGACAATATGATAT 

TGTGATATATTAATACTGCCCAACATTCATCGTCGTCAAATCAGAATTCAGAGCAAAAAAGAGACGTTTA 

CGTTACATTCCCCGATGTTTTTGTGACGTAACAAGCCGAAGAGAGGGAAAAAAAAAGTATGGTTATTGAA 

AATCTAGTTAGGATCTACTTTCCTTTTTGTCTCATCTATTTATCAAACACTATCAACGCGTTTTGAATTG 

ACGACCAGATCTATATCATCTAGTTTATAATATTCTTTGTCAGATCTGAATTGATCAATGTGTGGTTGTT 

GTTTGTAGTTTTTTGTTGGATTTAAACTACTCACAAACATCAAGCTTTTGAGTAAGAATTGAATCAAATT 

CAATATTGTCTTGTCACTTTTTTTCTGCGTGGTACACTACTACGAAACAAAATTTAAATTGTCGTGTTCT 

TTTTGATAATTTGTTTGTTATAATTTTTTTGCTTGTGTGAAAAAAAAAGAGAAATGATAATTCGTTTTTT 

TTATAGGGGTTTTTCTAATTCAACTCTTATAATAAATTAACTTATCAACACCGTAAATATAATTAAACCA 

ACTGTGTTGCGCCATAAATAAATAAGTTGTTTCGGGATCAACACATCTCCAACAAATTGAATCGTAGGTG 

AAAATTTTTTTTTTACTAGTAATTGGTAGTAATGGTGTTCACGAGTATTTTTTTTTGGGGAGTATTTGTG 

TCCCTTACAAGAAATAAAGCCAGGGCCATGAAAAAAAAATTAATACAAAACAAAATATTCGTATCAGCAC 

AGCAGCACTTCCCCCCCTTTCCCCTTCGGCACGCCCTAAAAAGAATTTACTCATGTAGTCGTTATCACTT 

CAACACCACACAAGAATACCTCGAGTGAAAGAAAATTGCTTGGGGAATGTGTGTAATTGGCTATGTAGAA 

TTTGGTATTAATAACATTTCTACTGTTTTTCTTGTGCCATAACATACTTTTATCGCGATATATTGCAAAG 

CCCCCCCTTCTAGCTCCTAATAAAAAAAACCCACATTACTATTATATTTAAAGTGTGAATTGGAGGGGAC 

AAAAACAGAACAATGAGCAATTTATAATAGTGAATAACCTTTAGCAAAAAAAAAACATTGTAAATTCAAT 

ATTTGACGATGGATTTAACAAACAATCAATCAAATTCTTAGTGTTGAACTGAACTGAAGTGATATTTTTT 

GCCATATGCACAAAATCTTAAATATTCAAGTCTACACGAGAAAACCCAAAAAAAATGTTATTGTTTCAAA 

AATTAATGCTTATGTAACACAACGCCAAATTTAAACCATTTTTTTTGTGGTTACTAAAAAAAAAAACAAA 

CAAAACAAATAAAAAAAAAGGATTACAAATTTCAGGCACATTGTTTAAATTTACTGACGCCAATTATTGT 



TTGATTCAAGTATAAGTTGAGAATGATTTTCCCAATTTATTAAAACTACATACAAAAGAATATTAACCTT 

TCTATTTTCTTTATTTTTTCAATTTAAAAGATATAAAATCGTTTCACCTTTTCTTTAAAATTATAATTTT 

CAAGACTTACCTTATTTGCGTTTTCTAATCGCGTCCACTCCTTTATTACTACTATTAGCTTAAGTCTTTC 

GTTCAAAAAACAACTACAATGCGTGCCAACTATTTGTTATTATTAGCTGCCACAGCTGTTCAAGCTGCTC 

CATTCATTAAGAGATATGAAAACACTACTGCTCCAGCCAGTCAATTGTCCACTTCATTGGCTGATGGTTC 

CACTACCATTCTTGGTTCTTCATCATCCAGTGTTGAAGAAGATGAAACCATCACTTCCACTATCGTTCAA 

TATGTTACTGTCACTTCTTCTGACACCACTTACGTTTCTGCCACCAACACTTTGACTACTACTTTAACTA 

CTAAACCAACCCCAGTTATCACCACTGAAGCTGAAGATGACGAAGAAGACAATGAAACCATTACTTCCAC 

CATCCTCCAATACGTTACTGTTACTTCTTCTGACACCACTTACGTTTCTGCTACTAACACTTTGACTACT 

ACTTTAACTACCAAAGCAGCCGAAGCTACTGAATCCGAAGAAGAAGAAAACGAAACTATCACTTCCACCA 

TTCTTCAATACGTCACCGTCACTTCTTCTGACACCACCTACGTTTCTGCCACCAACACTATAACCAGTGT 

TTTGACTACCAAAGCAGCAGTATCTACCAACGACGTCAGTGAAAATGCCAAGGCTGCTACTACTGAAGAT 

GATGGTGAAACCACTACTTCAACCATTACTAGTATCGTTACTATTACTGATGCCAATGGTAACACCGAAG 

TGTTGACCGAAGTTGCAGCTGAGACCAGTGGTGCAGAAGATGCTTCCTACTGTGTTCCTTCTACTGTCAC 

TGTTACTGTCACTGCTGAACAAACTTCCGAAGTTGTTTCAACTATTGTTCACACTACCCAAGTTCCACTT 

ACTGCTGAATTTACCCTTGATGATACCACTACTACCCTTACATCTTGGGTCGACTTGACTTCTACAGATC 

TCGTTACTATAACTTCTACTTCAAGTGTCTATGATTCATACTCAACTGGCGTTTCTCAATCCCATCCAAT 

TCCTCATACTCCAACTACACAATTTCGGACTATGCCCCACCAATCAGTTCTTACTACTCTTTGTAAAGAG 

CTTGATATGAAAGTTTGTGATAGTGATACTACTACCGCCGCCACCACCACACCTTTAGAGTAAAGATTTG 

TTTTTAAAAAAATCATTCTCATCATTTTTTTTTTATTGGTTTTCCATTTTATGTCGTTTTTGACGTTACT 

CATTTGTTTTTATTGTATTTTGATAACTGGGTTTATTTGAATTTTTGCTTTTTTTTATTTTTATTTTTAA 

CATTGTTATTCCTTTTTCCTTTGATTATTCCTTTAGTGGTTGGTGTTATTTTGATTTTTGCTTACATTTT 

TGCTTACATTGTTATATTTGTTATTCCTTTGTTAGAGTTTTTTTTTATTTTTGCCCTTTTCCCTTTTGGA 

TTTTTTTATCATTGTCTGTCTTATTCAATGGTTTTCTAGTCTAAAAATTTTGGTCTAGTTGCTATTTCAT 

ATCTCTGTTCATTATCTCTATCCTTTTCTTAGAAACATCATTCTCTCTCTTTCTCTCTAACATTCCTCTC 

TCTCATATTCTCTACAATTGTCTAGATAGATTTTTTATAGTCCTTATTGTTTTTTATTTCTCTAACTATA 

TGTATCATTTTTTATTCTTTTACATATATCTTTACTCTTCTTTCTCTTTTTATTTTTTTTGGATATAATA 

AATAAATATACATTTGCCGTGTTATATTCAAAGATGGATTGATATTGGAATTGGAATTGAAATTGGTGTT 

GCAAAAAAAATAGCAACCAAAAAAAATGACAACATCAACAACAACCACGAATAGGAGAAAAAATAAAAAA 

AGAAAGGGAAAGAAAGAAAGGAAAACAATAGAGGTGGTTTGATTACATAAGCAACCAAAATTTCTCGCGT 

CTTTCGCTCTGTTTGTTTTTCTGCCTTTGAAAGGGATGACAGCAGCAGAAAAGCAAGAAGAAAAAAAACA 

ACACCTACAATTCTTCATTTGTTTTGAGTTGGCCCTACATTCAAAGATCCAATTTAGCAGTCATCAAGAA 

TAATTTACAATCGATCGACCTCAGTCATCACCAAATAGTCAAACCAATTATTAA 

>retrotransposon_25 104 7bp public: 1..1047; zeta-like LTR: 314 822 

TAATAATTGATTGGGTTTTTGGGAAATCACCAATTGTCTACAAATCTATCCATATATAACTTAACACTAA 

GGTTAACCTTGATCAAGAAGAAGGGAGTGGGGGGGGGGGTGCATTTATCCTTTATCTTGGCTATTGTGGC 

GATGCATAATTCGTAATATAACGTAATTAATGAGCAATTAAATAAATAAATTGATCTGATACAACAAAAT 

AAAAAGAAGAAATTTAATTAATACTGTGGCACGTGACAGTTGATTCTAGATCAATTCATAGTCCGCGTCC 

CCGAACCGAACAAAAACAGGGCAAAATGATTACTGTTGTAATATAGCTAATGCTAATTCTTGATTAGTGT 

GGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATTGTTAATACAGTTATT 

GCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTGAAAACCAACT 

AACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGTTAGAAAG 

AGAAAGGGTGGATTATAAATATGTGTAAAAATCCCCTTTAGAGACTAATCACTAGAAATCTATTGATGGT 

TTCATATATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATTTGAAAGCACTA 

CAGTATAGTATGTCAGAATCAGATCATTTAAACTCTACTAATAATACAGGAAACACTTTCATTAGTCTAG 

ATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGCTAACCCACAACACCACTCAGATTTAGCCCC 

TCTAAAATGCATATGGCACAATGATCTCACCTCGGTTGGTTAAACCTTTTTCTTCTTATTAAATCTATCT 

TAGTTGTAGGTTGGTCTCCCCCCCCTAACTAGTTTTACAATTCAATTATTAAACCAATTGTCAATTCTTG 

GTATTTTGTAAACAAGACTCATTAATAATCAATCGTCAATGCATATGATCAAAACAAATAGAAACTT 

>retrotransposon_26 7929bp Incyte: 1..7929; zeta-like LTR: 3346 3853 

AAGAGATTGTAGTGAAGAATTCAGCTCATTATTACTGTTTTGTCGTTGCTGGAAGGAGGAGGGATAATTC 
AATGCGCCACAACAGTGTTACTATGCATGTGGTTCTGACTGACTGATATTGTTTAAAAATTAACCAGCTC 
TCAAATAACAAAAGTTTAAATTTTCAAGGTTTGTAAACATGGCAGCTAGTAGTAGGATGGTTCATAATAT 
TAATTAATTATTAGTAATAATGGCTAAGTTTTTGAAGCATTGTTTTAAATTTTCAAATTGAAATTCAATT 



TCATTACAAATGGATTACTAACGGAATTCCTAAGCTCAACTGAATACCGTGATTGAAACATTTGAATTTG 

TATCTTTTAGATTAGCTATTTTTACTTTTTTTGTCATTGTAGTTGGTTATGATAATTACAAGAAACTAAA 

GTTTAATATTTTCATATTCATTTTCTTTTTTGGCCAACTTGCAAATAACACACAAACCCAAAATTAAATA 

ATTAGATTTAATGCATGCATAATTACACAGAATGTTTAGCCTTAACAAGTATTCTAGAAACAAGAAAGAA 

AAAATGTCGTCTTGGCGTTTATCTTAATTGTATTCTGTAAACTGGGTTAATTCTTATTTCCAACTTTTCA 

TTTTTTTGGATCTTGTATGGATTAAAAATTAAATATGGTATGTTTTAGGGTTGTATTAACAATACTTACA 

ATTATCAATCATACAGCTTTACTATTTTTATTTATCAGCAAATAGGGGAATTCAAGTTGCATGTGTTATT 

CAGTGGCAGTGAATCATAAAACAGCCAACTTGCAGCTTATTTCACTCCAGGAGCAATCATCACGGAATTC 

CGTTTCCCATCTCATTTTCATACTCTGTGGATTATGTATAGAGGCTATTTACAATATCACCAAGCAGTAA 

AACATTCTCTCCTCAAAATAACAATAAGATTAGTCAAGATGAACGACTTGAATCTATTCATATGCATTAC 

ACATTTAGTTTCTATTACAAATAGTGATGCAATGGTGCAAGATTACGTCTTGTCTGCACTAACTATTTGT 

AACGATGATTATGTGATCAAGAATTGGAATTCTTATTATATTCAGTCGTGAGTGTAAGCTATTTCGTTAG 

GGTTATCTTAACTCGAAGTTAAAGTTCCAAAACTATTCCATTTGGAGTTTCTGTTGTTGAGAAATACAAA 

ATACTCTTCTTGGTGGGGAGGAAATCCATTAATGATTATAAAATGAAACTCTTGGTAACCTAATTGAAAC 

ACCACATTCAGTACATTTTCAACCGTCACTATTATTATTGTGGCAAATGGATTAAACAATAGACCTAACT 

TAATCTAATGGAAATTTTAAATCCATGAAAGGGGTGAAAATTTGAAATCAAAATAACTATCTGAACTGAA 

ATACCCCATGGATCTGATATCTTATACAATCTATCAACTAAACAGGGAAGAGTACCTGGAATTCCAAATG 

ACAATTCCTATTATAATTATTTAAACAGACTATGCCGTATTGTTTGTGACATTCATTGTTTTCCACAACT 

CTAATGTCAAATTTTTGTTATTGTCATGTAATCCCGGTGTTTCTTTTTTCTTTTCGGTGTTGCGTTCCAT 

GATATTTTGTTATCTCTTGTTTAGATTGAGATAAAGAATTGGTTAGCAGTGTAGCCATTTATGAGTGGTT 

TGTAAAAACAAGAATTACAAGGTTTGAATGAATTCCAGGCAGGCAGTATTATAAAACCTCGAAATAACTA 

ATCAAACCATCAGAAAAGAAAGCTTACTATGATGTACTGCTTAATCTCATATCTATCTTACAAACTTAAT 

TCACTGATTGTGGCTTGTCCGTGAATAATTCGGAAACCTTGTCTTTTTCGGTCCAGTAGGGGGTGCCATA 

GTCTTGGGTGGTGACAAAAAAAAAAAAAATTATAGTTGGGGTGGTGGGGTGTACGTCTGAGTAAGTCAGG 

GGAATGAACTCAAGACAAAAATAGAAGTTCTAAACATGGTACGTTCTGCTAAGTAATATCATCGATCTAT 

CTATTTTGCTCTAAATTTTCATAAGCAAATCCAGAACTTCCTCGTCAGTTTCAATTTCAAGCATACGAAG 

GGATAGTGATTAAATTATATTTTGAACCTTCTATTACTGATTAAGTGTTCCTATTAGTCTACGGATTAGA 

CGGTTAGAATGGGATTTTCAAAAGCACAAAGGTCAAGACTTATAGGAAATTCATAGAAAAAACACTCTGA 

AGTACTCGATGGTTGGATATATAATAGTTTTGCTAATTTAAACTCTTGCTGTTCGGCTAAGCTATTGTAC 

CCAAATGCGGTACTCCGATAGTCTTATAAATAATACTTGGCAAAAGTTCAATAAATATATGTCAATGGTA 

TTGCTTTCCAATTACCATTGACGAGGTTGTAAATTAATTCATACTTAGGTGACATCGATTAATTTAACAA 

ATATGTCTGTTTCAACGCTTACATCATCAGTCTTGCAGGAAAAATGTTATTGCCACGACACCTCAAATTA 

GCCCAACCCCTTCGTCTACCAAAACAATGTCAAAAACCCACTTAAAAGAAGTCGGACAAACCTGAACCCG 

GTATTTTATAAAGTAGTTTTGTGAATAATATCAGTACATCGATTACACTTTCCGTCTCAAGACTGGAAGT 

TGCAAAGCCATGACAATTGCTCAACCAAATGTGAATTTTTAGGTTCCATAGTCTTGATCGGGTAATGTAA 

ACACTTTAACTTTTAGTAAATGATACCACCAAGAAGAAAGCACTATTTTAAGCTTTATTTAACACTATAC 

ATTGGAAAATAAAAAAGTGGCTATGAGAATTAAACAAGATGACCGAGTAATTAAAATAGTGCTGTCGGTG 

TTAAGCAATACCGCTAGGGTTCAATCAATTAAGTGCTGCTTTTTTTTGTCGTTGTATTTCCATTCCTCCA 

CTCCTTTCTTTACTCTTGCAATCTAACATATTTTTTTTAAAAAGAAAACATATTGATACTTACATGTGGT 

AACTATTGTCTGATTCATCAATTCCGCTCTTCAATCTCGGTGTTCGGATAATTTCGATGAAATTATAATT 

ACCTGCCGCAATTCTAGAAATTCCTTTTTTTTCTTTTCTTTTTCTCGGAGTTGGTTCCAATACAAAGATT 

GAATTGAATTAGGTGAGAAGAAGAAGAGTCTTAACACCAGATGTATTACAGCTTTAAACTTTGTTTCTAA 

TTTGACCACAAAAAGTTGTCTGGACGCCTCAGTTTGAAATTAGTTTTGGGAGATTTCTGTTTTCTCATTG 

GCCTTACTCTATGGAAGTTTTTATACAAGAGCTTCCTTCTAAAATTAACTCTTTGTGTTGTAATATAGCT 

AATGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATAT 

AGTTATTGTTAATACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTT 

AATTGAATAGTGAAAACCAACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATA 

AAACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAAC 

CACTAGAAATCTATTGATGGTTTCATATATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTG 

CTAGTATATTTGAAAGCACTACAGTATAGTATGTCAGAATCAGATCATTTAAACTCTACTAATAATACAG 

GAAACACTTTCATTAGTCTAGATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGCTAACCCACA 

ACAACAGCCTAGTCTTCTTGACACTAAAAAAAAAAGAGATAAAAAACAATTTCAGCCAATCACATGTACT 

ACATTTGTAATAGATTTTATTACTTCAGCTGCTTATTACACAAACAAGGTTGAATTGATATTGTGTAGAG 

TAAATTTTCGGAAATAGTTTGAATTGGGTGATCATTTTCTTTATTTTTTTTTATGTCTTGTTTCTGTGAA 
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GATCGGAATGCCAGGGTGGAGCTCGTGAATTGCACCACTAATTGCAGCAGCACCATATTTCAAATAAAGT 

TTCTCATGTTGTAATAGGATTGCTTGTCTCCATGAAACCAATCACTTAACTAAGCCCCAGGCTGATTAGT 

GTGTTTTCAAACAGTTTTGTACTAGAGAAACTCAGACCTTCTCAGGGCAAGTAATAACCTAAAAAAATGC 

CACAAAACTAAATGCAATTTCAGTTTGATATGATAGGCAATGACATCAACACCTGGAAAAAAAAAAAACT 

TTCAGGTGATGAAACGATTAAGGATTAAAGTTTGCAACGAAAAACAAGTGGAACTAAACTTTGCCTTATT 

GTTTTGTTCCGCTTACCTAATGATGTTTACTCCTTAGAACAAACAACATCAACTACTTTTAATCCTGACG 

ACGAAGAAGAAGACCAAAAAGAATAATTAGCCGCAGCTACGGTGGTGGCACTAGTAGTAGTGCTAGTGCT 

TGTTGTGTCTCATCCAAGAGAAATGGAAAAACTGCAAAAATGCCGCAACTTTGAACATTTTGGAACACAA 

TACAACTTTTTTTTTCCTTTTGGATTTACGATTAGCGCGATAGACGTGACCATAAAAATACCACACGATG 

TGTAGATCCTCTAAAAATAATGTACACATTTCCAGGCTTTTGTTTACTGCTTAATAATTTGTCATCATCG 

GTAACAATGATAGTCTCCCCACCCTAACTACAGTAGACGGAATTAGACACCAAAGATCTTATAAATCAAC 

CCCAAATTTTCCCATTTTGATTTTTGATTTTTTCGTATTCCTTGTTGTTTCCATAATTTTTTAGTTACTC 

CTCCTCAACTAAACTAGATAACTCGTCACAGTTAACAACAGAAAGGTATGTTAAATATTTATTTCGTTCT 

AAATTCAAGTTTGGTATAGAATATTGCAAACAACAACAATTTGAAAAATGGACTTTAATTTGTTCTACAA 

AATGCAAACACATCTAGAATTAATATTTGCTCTGGAAACCGTATACGGAAGTTATGGATAATCACGTTAT 

CCTGATATCTATTATTAACACCACCACAATATCTATTATTTCTTGTATGGATTGCGGTGCCAAGATCAAA 

GAATCATTTTAACCCGATATCTTACATTTCACCTCGATCTAAATGTGATTCAGTATCACCGCCTCATTGT 

TTCACCACTCAACCTCCCCATACTGGCAGTACATATTTTTTTTTTCATTTTAGAGAGTTTTAACATAACT 

TATCGGCATTTTCAATAATGTTTATTTGGAAATTTAGTATATACCGATAAATCCTGAATTCTCGTATTGG 

CGATGGATTTACCAAAAAAATGGGGAATGAGTGTACACCAAGAAAAAAAAGAAAAATTCAAGAAAAAGCG 

AGTGACTAAAAATGTCGTGGGAATTTAATTTATCCTGGAAAGATGCCCCGATTCAGAAGTAATGTCGAGT 

ACTTTCACCCACATACAATGAACGACTTTTATTTATTCCTTCACCCCACACAGCAACAACTACATTTAAA 

TTTCAGTATTTAAGCGACCATGAATTTAAATTACAATACTCCACAGATTAAAGCATTTTGTTTATAACTT 

TTCTATTCTTATCAATTTTTTTTGGTATAGTTGTGGTTTGCGTCACGGTTGTTTTCTTTTTTTCATTTTC 

CTTAGTTTACTCCACATACACATACACGTACATTTCTATATATACCCCATGATTCCCCCCCCATTTGATT 

TTTGTTGTTGTTGTTCAGCAATATCTACTTTATTTATTGGTTTTTATGTTTATATGATACTAACTTGTCT 

TTGTTTGCTTTAGTCATGAACTCCGATATACCACCTCCACCACCACCTCCAGAATATACCCAGTCCCATG 

AAGATTTACCAGCATACACTTCGTCGTTGAACTATTATGGATTATCATTGATTAAAACAGAATTCATAAC 

CCCATATCAATACAATAGCGGTAACCGTTCCTGGAAACCAGTATTGCTTGAATTGAACTCTACTCAATTG 

AAAATATACAACTTGAACATTGATAAGAAACTACAAGATTTGCTAATATGTTTATATTTTGAATTAAATT 

GTTTAGATCAATTAACTAAAGACATCAATTCTCATTATAAAAAGAGTAAAGGTTTTGACTTTAGTGAATT 

ATCGTCTAATGATGCCGACGATGTCGGCGATTTGTTTTCCGGTGATGCATATGGTGGTACTGATAGCTCC 

AAGTTATCTTTAAATGATTCCAAGTTTGGCAAATTGAAAAACAAATTGAGAAATCAAAAATCTAATAAAA 

CCTTGCAATCAATAAAAGCTCATTACGATGAATTAAAAGATAACAAATTTTTCTTTGAACCAACATCCTC 

AACAAAGGAATATAACCAATTCGCTAAAAAGTATAGAGGAAATTTGTTGCACTGTTATTCTTTGGCAAAC 

TTGCAGATTGGGGAAGCACCATCTTTGAACCAAATAATTTCAGCAATCTACAAGGAAGAGCATAATGGCA 

ACACCAACAATTCATCACTCGTCAAATACAAAAACACATTGCGTCTTCGAATTGAATATAAACAAATCTT 

ACTTCAATTTTGGTCTTTCTACGGTATGATCAGTTGGTTTAGGAATTTCACCATTGGAAGAGATTTGAGT 

GTACCCGTCGAAGCAAGACATGTATCGAAACTCAAATCTATACCCTCAAGAAACACTAGTCAAAACAATG 

CATTATTGGCCGCTACTGCCGCAGCTGCAAACTATGGAAGAAACAGAGCCAATACTCCAGTGGACGGTGT 

CGAAGAAGACATATCCATGTTTCGCTCCAACTATTTGACTATTAAAGATGAAGATAATACTCATTCTGAC 

ACCAGTAGTGAGAATTCATCTGTGTTCGACAATGAGAGAAGAGGGTCCATAGTTTCAACAACTACGTCAA 

TCGAACCAGTCGACTATGTTACTATTAACAATTACAAGTTTTATTCCCAAGAGTACACCTTTACCACTGT 

TGAGAAACAATACATTTCCAATTGCATACCAGATTTGAACTCTTTTGATAAATGGAATGGCAAGTTAATC 

ACCGTCAGTAACGTGGATCATTTTATTAGAGATAAGAGATCTTTTGAAGACAAAGATGACGTTTTCATTA 

GTTATGCTGCATTGGGGAACTTGGTACAATCATATGATAAAAAATCACATAACGACTCATCCATGCTTAC 

CACCCAAACTTTTATCATTCATCAAAAAGGGTTAGTTGGTTTAGGAACACAAGTTTGATTCTTAAAACAT 

ATATAGATTGATAGATACCATTTAATATTTCTAAACATATCTTTACGAATTAATAAATACGACTTTTAAT 

GATATAAGGTATTTTGGTTGTAATTGTAGATTTGGCAAAAAAAAAAAAAATAAACAACCATCGTAGTAGT 

TGTTGTTACAGTGGTTCAAGTTCACGCCCTAAATTCTTGTGGCTGTCTCGCCTTTAACTTTCTTTCTTCC 

TCCCTTAACTTAACATGTACGTGTACTTAATATTATTTTGAAAAATTTTTTTTTTCTGTCTGTTTCTCTC 

TCTCCTTTGTTCCCAACACCAGTTGGTACTTTTAATTCTATTTTATTTTTACGTTGATCTGATATTTATT 

TATATATTTATATATTTCCATCAATTCTAAAACTTAATTACTTCAAAGACCAAGTTCTTGAATCTTCTTT 

TGTTTTTGCTTGTTTGTATACCAAAACACTCTTTTTCAATTATTTCCCTGCTGTTTTTCTTTAGAAAAGC 



ATTGTCCATTTGTCTATTAGTCTGTAACTGGAAATTTGTCCCGTCCTTAAATTATTTTTTTTTTGAAGAA 
TCTTTTCATTTGAATCATT 

>retrotransposon_27 2292bp Incyte: 1. .2292; zeta-like LTR: 1327 1834 

GATATTAAGTCGTCTAATGCTATTTTTTATTTGAAAAAAAAAAAACAAGAAAACAAATGTATAAAGGTGG 

AAGGAAAATAAAAATTAAAAAAAAAAAAAACTCGAATATTAAAATGAAAGTGGACAATTAATTGATTGAT 

TAATAAATTGGTTTTATTAGTATTATGTAAGGGATTTCAAAGAAGTCATCTAAAAATTGTTAATGTAGAT 

GTAGATGTAGATGTGGTTGTTGTTCTATGTGTTTACAGAAATTGATCATCAAAGTCCAAGATTTTACATT 

GCCTCGCCAGTTCTATTTTTATAAATATTGGCTGTGTGTTTTGGGTGTGCTTGGGCCGGGCAGAGGGTGG 

GAGAGAGGCATGAATGCGGAAGAGGAAGGAGGTCATTCCATTCCATTCCATCGCCTCATTCTTCTCCATC 

GTTCATTCATTTAATTACGACAGCAGCAGAAGAAAAAAAAAAAGAATTCAGATGTAGATCACGTGCCAAT 

ATTATGAAATATTCCATTTTGGGAAAGTCAGCTTCAATGGCTTACATGGTAGCGCATACTCATAGATTTT 

AAAAAATCTGAATAATTTGTTAGTTCTCTATGAATGAATAAACAGATTACTGATAAGAACCAGATTAATT 

ACTTAGAGGTTTTCTTATTTTTTCTTTTTTGATAGCAAAAGTATTCATGAATTATTCGTATTCGTAAAAA 

ATTTAAGAAGGAGGGAGAACAACAACTGTTAACCCAAATGGTGTTTTTGTTAAAACTCTATCTACTAAAT 

TCAACATTTGTGAAGATAAAAGTGGTTCAAATTTTTTGTATGAAAAAACAACATAGATTTATATAGCAAC 

ATCACTACAGTAATATATCGAATACAATAAATATATATATATAATAAATTAAAATAAAAATAAAAATATA 

CATCTACAATATGAAAAAAATCATTTAACTATATAGTATGTCTAAATTATCGAATGAAAGTTAGTAATAC 

AAACTCCCATGTTTAGTGGGGAGCTTGGTAGAGCCTTCAAGGCAATTCATAGTAGGTTGGAGGAGGCCCT 

AATCAGAGGGTCTGAGTTGAACAAAAGCGCCCAAAGCTTTGTTTGATTCATTGGAATATACTCTCGGTTA 

TGTCGAAAGTATTGGAGCTGAAAATAGAAAAGAAAAAAGTGAATAATTATGATAATTATTGGTGTGATTT 

TGTCACCTTTTTATACCCAATTTTTTTTTATCAAGAGAGATTCTTAGATTTGCCATTTTGAGTGTTTCAA 

ATTTCCCATGTGGATTGAATTTTCAAAATTGGTTACATATATCCTTGAAAGTGTTCATAATTTTTGTGTT 

GTAATATAGCTAATGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAAC 

TACCTTAATATAGTTATTGTTAATACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGT 

TAGGTTGAGTTAATTGATTAGTGAAAACCAACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCC 

TATTAAGGATAAAACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCTT 

TAGAGACTAATCACTAGAAATCTATTGATGGTTTCATATATAGAGTTTAACGATTATATTTATAATATAA 

GTTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTATAGTATGTCAGAATCAGATCATTTAAACTCTAC 

TAATAATACAGGAAACACTTTCATTAGTCTAGATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGA 

GTTAACCCACAACATTTTGTAGTCGTAAACTTGAAATTCAAAGAGAAGGGGGGGAATTAAATTGGGTGCA 

ACGTGTTTGTCAAAAATTTGGTGTGAAAAAAATTAATTTAACACTCTGCATTGTACCATAGGGAATATAA 

TACCCAGAAATAAGAGAAATTATCACGTGAGACTAAAACTAAATATAATAAATTAATATCACAATTGAGA 

AAGACACTGAAACTAACTTCTTGGTGTATTAATTTTCAACACTTGATCACAAGTGCGGGGATTAATCATA 

ATTGCAAAGAGTGTGTTAGAAAGAGCGAAGGTGGATTATGAATATTGGAGAATCCTCTTTAGAGACTATC 

CGCTAACAAAATAGATGAACTTGCTCAACAGAAACAACTAATCGACTAACTGACTAAAATTAATATACTA 

AGTATAGATTAAGTTATCACGTTAATATTCTATACTATCCATCTCCATCACT 

>retrotransposon_28 2025bp Incyte: 1..2025; zeta-like LTR- <794 1294 

TGGGGAGCAAATGTGAAATTAAAGAGTGTGGTGATATGTAATTTTTTTTCAAAAAAGATTGGATTGACGA 

AGCATTATATATTCGTCTAAAAACCATTTTTGCTGGTTCCGCAATAAATCTCGGAGATTATTTCTCGATT 

ACCAATTTATGTTGTTTTGTGACATTTCTTATATTTTGTTCTATTTTACACGACTATTTATTGTTAATAA 

ATATGTCACCTAAAGAATATTTCTATTTAGTTTTACATATGTTTTTTGACGACAATCAACTATTACAAAT 

TAACCTACATTTTTTAATTTGAATATATACAATTTATATTGAATTAACATTACCATTTAGTTTTTGATAA 

GAATAGATTGCGCTATTTCAAACATTTGTTAAATTATTTATTGTGAAACAACTATGTAGAATAAAAGTAT 

GAACAAATTCTACGTTCATCATGTGGGGTGTGCCTTCATATATATCTTTGGATGAGAATGCCAAGAAAAA 

TGATGGCGTGACAATTCAATACGGCAAAACAAACTAATCCCCTCTAAGATTTTACTAGTGTGTTTCCCTA 

TCGTCTGAGGAAAAGGTAACAAAACATCGTTTAACCAATTGGTGTTTGTTACGATGGTGACGTTGAGTAC 

TGCATATAGTTGCAACGGCAAATTGCATCCAGCGAGTTAACAGCGAATGGCAAAGTGAAGCCTCCGACTT 

GTGTTCATTGACTACTGGGATTGGACTGGGAATAACGACTTAACTAATTAATGTTCTCGTGGACTCGTTT 

AGCTAGAACTAACATTTGTTATAATATAGCTAATGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAGGT 

TATATTGCGCACAGGTTAACTACCTTAATATAGTTATTGTTAATACAGTTATTGCTGTTGACTACTATTG 

TTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTGAAAACCAACTAACTACCGTATTAAATT 

ATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATA 

AATATGTGTAAAATCCCCTTTAGAGACTAACCACTAGAAATCTATTGATGGTTTCATATATAGAGATTAA 

CGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTATAGTATGTCAGAA 



TCAGATTATTTAAACTCTACTAATAATACAGGAAACACTTTCATTAGTCTAGATCAAGCCAGTACAATAA 

TGGCAGATCAAACTCAAGGAGCTAACCCACAACAGCATTGATTATATAATCATCTATGTAGCCAATATAC 

ACTACCGTCCAAACTCCCACTACACACTTGTAACAGTGTTTTACAAATCTATGAACGAATAACCGATTCA 

AATGACACAATAAAGAACATTTCACCGATTTGAATTGCTAATCGGTACTATAATATTGATGGAAGGTTAA 

GAGTTTAATGCTACCCTAGGTTTACCGGAGATCAACAGTTGCATATACAAAACGTGTTATCTGTCTACGA 

ATGGCTTTCTATGTGTATAAAATGTTTCATCAATTGATAATTAATTATTAATCTGCTTACTGAGGTAAAC 

CCCTTTTAATGCAATAGCAAATATGAGGTATTTTTTTGCTATTGACATGCGTATATGAATCCATTTGTAT 

CAAATTGCCGATATAATGAAATGGAAATTAAGGGAAAAAAAAAAGTTTATATCCAAATTCATGCGATTAA 

CAGGTTCTTGTGATTATAATTGGTAACCCCCTCCCCCCTAAAACTCATATCTGCCAAAAGAGGAGGATAT 

TTGAATATGCTATTATGAACCCCATTGATTTTGACTACAATTGGATTTGTCGGGTATTGAAACCCAAACA 

TATTATAATTTGCTATGCGTTTAAATCAACCGTTTACTGGTAGATCCTATACTATAAATACAGCCAACAA 

TCCCCAATTGTTCAGATAAAGTAACACTCAATATCATTTGATCAATCAATCAAGAGGATTACAAA 

>retrotransposon_29 2731bp public: 1..2731; zeta-like LTR: 380.. 887 

ACATATTTTTTTTTAAAAAGAAAACATATTGATACTTACATGTGGTACTATTGTCTGATTCATCAATTCC 

GCTCTTCAATCTCGGTGTTCGGATAATTTCGATGAAATTATAATTACCTGCCGCAATTCTAGAAATTCCT 

TTTTTTCTTTTCTTTTTCTCGGAGTTGGTTACAATACAAAGATTGAATTGAATTAGGTGAGAAGAAGAAG 

AGTCTTAACACCAGATGTATTACAGCTTTAAACTTTGTTTCTAATTTGACCACAAAAAGTTGTCTGCACG 

CCTCAGTTTGAAATTAGTTTTGGGAGATTTCTGTTTTCTCATTGGCCTTACTCTATGGAAGTTTTTATAC 

AAGAGCTTCCTTCTAAAATTAACTCTTTGTGTTGTAATATAGCTAATGCTAATTCTTGATTAGTGTGGAA 

AGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATTGTTAATACAGTTATTGCTG 

TTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGAATAGTGAAAACCAACTAACT 

ACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGTTAGAAAGAGAA 

AGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACCACTAGAAATCTATTGATGGTTTCAT 

ATATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATTTGAAAGCACTACAGTA 

TAGTATGTCAGAATCAGATCAATTAAACTCTACTAATAATACAGGAAACACTTTCATTAGTCTAGATCAA 

GCCAGTACAATAATGGCAGATCAAACTCAAGGAGGTAACCCACAACAGGTTATGAGCCTCGCCCGCTTAT 

TGAATTTAGATAATATAGGGGCAATGAAAGCTTTTGAAAGTGTTGATTTTCCTGAATCATTAAAACTAGA 

ATCCAAGATTAATTTTCAAGTGTGGAGAAATGAAATCCTTAGATATGCACGTGGTATTGGTGCTGAGTTT 

GAAAACTTTGTATTGAATGAAACTCCAGCTCACCTGTATGATCTTAGATTGGGAAATATGCTTCATCAAT 

TATTGATTCGCACTGTGAAAGAAAAAGTTAGAATGCCTAGGCAAGAACTTGGAAAATCAGGAAAAGAACT 

TTATCTTGATCTTATTAAATCATTCGGTACTCAATACCCATACGATAAATTTGAGATAGTTAAATACTAT 

TGGGATCAGTTAACAAACCCTTTAATTAATGTGAAGAGACGTTTTGAAATTGAAGAAGTATGGGTTCAAT 

ACATTAATGCTCAAACTGCAACAGAGAGAGAAGTTCTTAATTCATTTGTTTGGTTACATTTGTCAAAATC 

TATATTACCACAAGAGTACCTTAGAAGTGCCCATCCAGTTCTTGATAAAAATGTGATTAAAATATTTCTT 

GATACCCATCCAAAATGTGATATTGATCAAATTATGTCATTTGTAAATAATGAACTGATTAATTATGTAG 

GGAAAAATGATACAAGGGAAAATGATATGGGACAGAATTTAAGAGAGAGTGATTTAAGAGAGAGTGACTT 

AAGTGAAAATGATATACAACAAAATGAGTTAAGCGAAAGCGATTCAAGTGAAAATGATTTAAGAGAAATA 

GCAACAAAAGAAACTGTTAGTGAACTTTTTGAAAATCAATGTCAGAATTGTTTTGGACTTGGTCATGATT 

CATATGAATGTTCACTGGCATTTAGAAACAATCAGTATATTCCAGATTTATTTTCTAGACTTCAGAGTTT 

TCGTGGAAATAGAATTCAAAATAATAATAGAAATGTCTGGTCTAGATTCTCAGAACAAGATGAGTCAATT 

GCAAATACAGAAAAAGGTAACTAGATCTAATGATAAAAATGAAAATCAGTGGCAGTCAAAACAATTTACA 

TATTAAACAAGTTTGAATGTAAGTTGTTGTTGTTTAGATAAACTATGTCATGGTATCCAAAGTTTTATTT 

TATATTTATTATTTAAGTGGTCATGTTTATTTACTTATAATTGTTATTTAGTTTTTCAAGTGTGAATTTT 

ACTTACTTATAATTGTATTTAGTTTTCAAGTGTGAATTTTACTTACTTATAATTGTCATTTATTGTTCAA 

GTGTTATTTTTACTTACTTATAATTGTTATTTAGTTTTCAAGTGTGAATTTTACTTACTTATAATTGTTA 

TTTAGTTTTCAAGTGTTATCTTTACTTACTTATAATTGTCATTTATTGTTCAAGTGTTATTTTTTACTTA 

CTTATAATTGTTATTTATGTGTCCAAGTTTTAATATTATTTACTTATAATTGTTATTTATTGTATATGTG 

TTAATTTAATTCAATTGTTAATTGTTATTTATTGTTCAAGTTTTAATTTTATTTACTTATAATTGTTATT 

TATTGTTTATGTGTTAATTTAATTTAATTTAATTGTTATTTTTACTATTTAAATGTTGATTTTATTTATT 

TAATGTTAACTTGTCATTTTTAATTTTACTTATTATATTTTACGTGTGACTATTATCTATGATAAAACAC 

TAATAGTGGATATTGAGTGTTTATTTGTTTCATCGCAGAGGATATTTATTGGAGGAGGGAGAAAATGTCT 

ATTTGGTATAAGGAAGACCATAAAAGTTGGTTCCAAATAGTCAACCAACCAATAAACATTCCCTCATGCT 
T 



>retrotransposon_30 2858bp Incyte: 1..2858; zeta-like LTR: 814.. 1321, 
reverse transcriptase fragment (contains stop codon) : 635 >537 

CCTCCGGGCGTCTATTTACAAGCTGCTTTATTATTTGTTATTACCTGGGTGTAAAAGCCCTCTTGCATTT 

GAGCTATTTCTATTCCCACTTCGGTATTTTTTTTACAGCCTCGTTAGACGAGTTCTTGATATTACTAAAT 

TAGTTGTTTACTGAGTGGCCTGATGGTTCCTCGTCACTCTAGTTTTTGGTCTATATAAGGGTCAGAAATT 

TCCCTTCTCCTTAGGTCCATCAAGTCAAGATATACATTAGTTGGTAGCATCGTATGGAATTTTCGTATGA 

ACGGCATACCAAGTATTAATTTCCGATCGAAATTTTTTAGGACGTCTTGATAATCAGGACAAACATCATG 

AAAGGTCTATACGACGAAAGTTTACTTTACACAAGGGGAGACCATATGTCTTCTTTATTAACAACTAGTT 

ATATAGCGAACAAATAAGTTTATACAGAAATATATGTACACAAACAAAGTTATTGTTTATTAATTATTTA 

ATTAGCTCGGAAGAATAACTCTGTGATACTGCATACATTCAAACAAAATCAATCTAGTTTCCAACATCTT 

TTTCACTTGGTAATGTAATTATTCTTGTTCTGGCACCGACAATGGGTATTGTTTTGTAGCTGGAGGACTA 

ATATGGGGTACCACCTCAATTTTTGGATCCCAGCTCCCACGCAGGGGTGGCTTCTGATCTAACTCACTTT 

CGAAAATATCCTGATAGTTTCCAATTAATTCAGCAAAATAGCTCTTGTTTGTACCCTTAACCAATGACAT 

GATATCCTTTTTATTATCACCGATACCACCTGTGTCTTCGTCTTGTTGTAATATAGCTAATGCTAATTCT 

TGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATTGTTAA 

TACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTG 

AAAACCAACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTG 

TGTTAGAAAGAGAAAGGGTGGATTATAAATACGTGTAAAATCCCCTTTAGAGACTAACCACTAGAAATCT 

ATTGATGGTTTCATAGATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATTTG 

AAAGCACTACAGTATAGTATGTCAGAATCAGATCATTTAAATTCTACTAATAATACAGGAAACACTTTCA 

TTAGTCTAGATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGCTAACCCACAACACGTCTTCTT 

CAGTATTAGGGAACAACATACTAACTTGACCTTTTCTAGCTTCAACCAAAAATTCCTCTATATCCATTAA 

TGGAATTTCATCAAACTGAGCAGCCCCAAAAAACGTTTTGCTTCCAAAGTCTAAATGAGCATGGAATTTC 

CTTATGAAAGGTATACCAAGTATTAATTTCTTATGGAAGCTGTCCACTACAGCAAAATTCTCTTGGAATG 

TAATACCATTAAACTGGAACTTGAGGTTAATTATTTGGTTAAAGTTTCTGTTGATTTTTGGTCCAATAAA 

GTACCCAAACTACTAGAGCTCCAACAACATTTTCAGAAAATGGCCAATAATACAATAAGTGGGTATATTT 

TATCAAAAGAGTTTATATTATGGTTACTCGACGGTATTATTCTCTGTTGATTTAAGGCATTCTGGTCGAC 

CAGTGGACAAAATTCAAGAGTAGTGTTTGTTTAGACTTTACAGGACATGATAGTATATATAACAAAAATG 

AAATACATTAATCAAAACTAACTAAATCCTAAATTAATGCCAATTTCTATTGAATTGGTTTGCTACTTTG 

TAAAATTTGTGAGTAATCTTAAGTACTTATATGGAAATCAACAATGGCAAAAATACAAGAGAATGACCCC 

ATGACACATTCAGTGCACAATTCATAGTAACTGCTTGGTCACTTGCACATGACTCTGCTAGTATACTCAA 

CCACTCTTGTGACTTCCATATAGATACTCTCGATGAAATGTCTCAAATTAGAGGACAAACAATCTGCTAT 

AATCTTGGCTAATCACCCATGTAACATGGAGGAACCAAACACATAGATATACGGTACCATTTCATACAGA 

ATTTATCACTAAAGAAATTAAGAAAAACTTGTGTTATCAAAGTGGTTTGCGAACTTTGTAGTAAGGGAGA 

GTGTTGAGAATTAGAGATTCTAAGTTCCAGAAAAATATCTATATTTATATATATATAGGTAGTGCAACAC 

TACATAAAAGGGACTGATTTGAATGTATGTATGTCAAATGACACCCTTATAATGTTGAGTGACATCATAT 

CAAAATGGAAATCTACTGTATCAATTAAGAGATTACTAAAAGCAATATACTTAATATGAGGTCGTACTTT 

AAGATTGTGAATAGTATCAGTAGCGAGTGGCTATGTGTTGTGATGGAGCATCACTGGTAGTTTCTTAGAT 

GTAAATCTCAGTGACTATAAGCATACTAAATTAGTTATGAAGATATGTTCCATTAAAGTATTTAAAAAAT 

AATAGACAGGCTATCAATTTCTAATAGATTTACCGTCCAGATTATAAAAAAATTATCGAGATACATATTA 

CACCGATTGAATTAATAATAT6TCTACTACAAACCCATCACGGAACTTGATGCAATTGATTGAATAAGTG 

TCTCTCTAACGATGACATGTCCAATTCTAATCAAAATAATTATTATTCTAATTGTAATATCTGGTATTTA 

ATTATTTATAATTCACGAAACAGTTTGATTGGTTTCTGATTCTTCTGACAAAAATAAG 

>retrotransposon_31 1636bp Incyte: 1..1636; zeta-like LTR: <595 1098 

ATGTTTATTTAATAATTAAACCCCAGTTGACCAACTATGAAATAGTATAATGATAAATGCAAAATAAATA 
TAGTATGAACAATATGATAGTTTTAGTGTGAATTTTGAATAAGAAAAAGAAGGGATAAGGATATTTTTAC 
TAGGAAACTCAATTATAATTACTAATGATAAAAACTCCATCAGCTACTATTATTACTCAAATTTTAAATC 
ATTTGTTTATCACCTACACAAACAGGGATTGTCCAATATTGATTACTAAAATTAGAACAAATAAGAGAAT 
ATAATTGAAGTTAAATAATTCTTTTACTAAATCTATTGACCAAGAACTACATCAAGGGAAAGTGTTGCAT 
ATACATCTAATGTTTATTCTTGGTTAGAGTATTGATACAAAATTATATCATCACCAACGAATCACATTAA 
GGGAAAGTGTTGTGCATATACCTGATGCTTAGTCTTGGTTAAAGTATTTGTGTGAAAGGTTATCGTGACC 
AAAGATTATAGTAAGGGAAAGTATTATGAATAAATCCAATGTCTACTTTTACAGAAGTATTGACATGAGA 
GATTATAACTATCAAGAATTGCATTAAGGGAAAGTGTTGTAATATAGCTAATGCTAATTCTTGATTAGTG 
TGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATAGTTATTGTTAATACAGTTAT 



TGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTAATTGATTAGTGAAAACCAAC 

TAACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAAAACAGAGAGTGTGTTAGAAA 

GAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACCACTAGAAATCTATTGATGGT 

TTCATATATAGAGATTAACGATTATATTTATAATATAAGTTGGTAGTTGCTAGTATATTTGAAAGCACTA 

CAGTATAGTATGTCAGAATCAGATCAATTAAACTCTACTAATAATACAGGAAACACTTTCATTAGTCTAG 

ATCAAGCCAGTACAATAATGGCAGATCAAACTCAAGGAGGTAACCCACTACAGGTTATGAGCCTCGCCCG 

CTTATTGAATTTAGATAATATAGGGGCAATGAAAGCTTTTGAAAGTGTTGATTTTCCTGAATCATTAAAA 

CTAGAATCCAAGATTAATTTTCAAGTGTGGAGAAATGAAATCCTTAGATATGCACGTGGTATTGGTGCTG 

AGTTTGAAAACTTTGTATTGAATGAAACTCCAGCTCACCTGTATGATCTTAGATTGGGAAATATGCTTCA 

TCAATTATTGATTCGCACTGTGAAAGAAAAAGTTAGAATGCCTAGGCAAGAACTTGGAAAATCAGGAAAA 

GAACTTTATCTTGATCTTATTAAATCATTCGGTACTCAATACCCATACGATAAATTTGAGATAGTTAAAT 

ACTATTGGGATCAGTTAACAAACCCTTTAATTAATGTGAAGAGACGTTTTGAAATTGAAGAAGTATGGGT 

TCAATACATTAATGCTCAAACTGCAACAGAGAGAGAAGTTCTTAATTCATTTGTTTGGTTACATTTGTCA 
AAATCTATATTACCACAAGAGTACCT 

>retrotransposon_32 2125bp Incyte : 1..2125; zeta-like LTR: 1105.. 1612 

TGAGTAGCCTTTTCTTGGGCGACTTTATTAGCTTCATCAACAAGACGTTTATCTTCAGCTTCCTTTTCCA 

TAATAATTCTCTTCCATTCTGGAATTGGTTTTGGTTTCTTTTTATTTATCTCCTCTTCTTTCATAGCCAA 

CAAAAGAGTACCCAATAATAATATAATGGTGATACCTTGTGCGTACATTCTTGCTTGAACAGCTTTTTGT 

GCGGTATCCATAATTTTGTCTCTGTTAACCAATACCCAAGAACCATATAAGGAACCAGCCCAAGCACTTA 

TGATAATTTTATATTTATTGTCATTCAATACGGTGAAACATTTGTCACTAAGCGATAATCTGTTCCATTC 

ACGGTATTCTTCCAAATATTTAGCTTCCTGATACTCCGATTGATGCATCTTTCTATCGAATTCAACAGAA 

CCTTGATCAGCGAAAAAGGCAGCCACAGAAATTGTTGGCATAGCAATTATGGCTGCTTTGATACTTGGAT 

TGAATGTTGCAAATCTTGCTGGATGTCTATGCTTTAAATATTGGTACAAACCGACTGAAAGTGCACCACC 

ATAAAACAACCCTTTGGCACCTTCTGAAATAATATGTGAAATGTGAGCGTCTTTTTCTTCTTTGGATAAG 

ATCTTCATTGTGGAATTAAGATGACTTTGTGATTAAATTGTTGACTTCTTTAAGCCTTTTAATGTGGAGG 

AAAAAGAAAAATCTATAATTAAAAAAAAAAAAGATAAAGCAGATAATTCTTTGATCTTTATATACTTGGT 

CTATATGTAGTAGGGGAAAGTCGGAGTCGGAATTTGAAAAAAAAAGAGAAAAAAGAACGAATATTTAGAC 

TGTAAAATTCAAACCCCTGCTGATTAGTATATAAAAAAAATGAGTTCATTTTTCCTTTCTTTTTTTTTTT 

TTCGCGCGGATAGCAACGGTCATTAAGTTAACGAGATAAAAAAGAAACAACCAGATAATTATGAAAAGTT 

GTGATGGTGTCACGTGCGAACATGAGAGTCATGAATTTTGACGAAAACGTCAAGCTTCAGTTTACAAAAG 

ACCTCTTTATTAAAATCGAATTGCTTATAGGGTCGTCGATGATGAGAAGGTGTATGTTGTAATATAGCTA 

ATGCTAATTCTTGATTAGTGTGGAAAGCCTAATAAGGTTATATTGTGCACAGGTTAACTACCTTAATATA 

GTTATTGTTAATACAGTTATTGCTGTTGACTACTATTGTTATTGTTAAATTAAAGTGTTAGGTTGAGTTA 

ATTGATTAGTGAAAACCAACTAACTACCGTATTAAATTATTGTATTAAGATTGATTCCTATTAAGGATAA 

AACAGAGAGTGTGTTAGAAAGAGAAAGGGTGGATTATAAATATGTGTAAAATCCCCTTTAGAGACTAACC 

ACTAGAAATCTATTGATGGTTTCATATATAGAGATTAAAGATTATATTCATAATATAAGTTGGTAGTTGC 

TAGTATATTTGAAAGCACTACAGTATAGTATGTCAGAATCAGATCAATTAAACTCTACTAATAATACAGG 

AAACACTTTCATTAGTCTAGATCAAGCCAGTACAATAATAGCAGATCAAACTCAAGGAGGTAACCCACAA 

CATAGAATACGTTTTCAACTACTTAAGTATCCACTAACCTAAATTTTTTTTTTAATAAAATTTCATTGTA 

TTAGTCTTTCTTACTGCTTTTAATCAACTATAAGTATAGGTTTCCGTTTTTTTTGCAGTAAAATTTATCG 

TTCAGGAGAAATAACAAAATGTACACGACTTATTCGCAGCATTTTTTTTTTTGTTTTGGGTTTTTGTATC 

AAATTGTTACAACAACAACAACAACCTCAATTCTTAACCAAATCTACCCCTCCTATTTTTTTTTCTCATA 

CACACAATACATCTTACACTATCTTTTGATAGGCTTTATTGAAGAAGTATTTAAGGAGTGTAATGACAAT 

CTGCTTAACTCATATATATATATATAGATAGTAGTCAACAATAGCTTTATCTACTTTTTTTTTTTGGCGA 

CCCCTGCAACTTCAGGCCCACCAGTTTGCCCATTTTGGTGCCCCCATTGAGTAAACATGGGGATTTGGAG 
CACACTTTTTTTTAGGTAAAAATGG 

>retrotransposon_33 1292bp Incyte: 1..1292; san-like LTR: 369.. 749, CTA2 
(transcription factor): join (974 >234, <888 1292) 

CTAATCCAAAAATCCATAACCCAACTGCTCAACGGCGAAATCCAAAACTTCCATGCTATTCTAGACCAAA 
CAGTGTCGAAACTCAATGATGCAGAGTGGTGTCTCGGCGTTATGGTTGAAAAGAAAAAGAAACTTGACGA 
ATTGAAAGTCAAAGAAGAAGCGGCAAGAAAGAAGGAAGAAGGGGCAAAGAAAAAGGAAGAAGAGGCAAAG 
AAAAAGGCAGAGGAAGCGAAGAAGTGTTTTATTTTACTTTTCTGTCAAATTTGCACTACTTTTAATTTGT 
GTGCAAATATTCTATTTTACTTGATTTTTATATACTTTTATTTTACAATACTTTTTTATAGGACTTTTTA 
TATCTTTTCTTTATCAACTGTTCGCTATAGGGTAGGTCTTCCAAGCTAATTTTACCCGACACAAGATGAA 



ATATTTTCTGTTGAGCACTCGTTGTCGACAGTGAAAAATTTTCACTCAAGAAAATATTTTATCATCACTT 

TTTCTAGAAGGGAGGTTCAAGTGTTGGAGAATAGACAGCGAACACCTGATATTCCCAAGGTCGAATTAGA 

TTGAAAGATAAATAATAGTCATATTTATTTTGTATTTAGTCAATAAATTATCTTTTTATATTTAAATTCT 

TAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCACATTTAACATATATTAAGCACCGATTA 

CCTGTGACATTCCGGAGTTTACTGTTTCGCGCACGCTGGCAGACGAACATCAACTCATCTTTTATACAAT 

ATATTCTTACGATTATAACTTTCAATTAAGAAATACAACTTCTTATTAGCATTCTCCTACAAGTTCTTAA 

GTTCCTAGGAATTTCTTCGAAACTATAATTAAAGACGAAAAGTGTAAAACAAACAGAAAGCAGAGGAGGC 

CCAGAAGAAGGCAGAGGAGGCCGTCCCACAAAAGTTTGACAACTTTGACGACTTTATTGGCTTTGACATC 

AACGACATGCAGAACGACGATACCATCGACGATACCATCGACGATACCATCGACGAAACCATCGATGAAA 

CCATCGACGATACCAACGACGAAGACATGTTGTCCAACATGGACTACGAAAATCTAGATCCGGACGAGAC 

CATCGACGAAGTACCTGCCACCACAGACAGCGACTTGGACATGAACAACATACTTGAAAACAACGAGCTG 

ATATTAGACGGGTTGAACATGACATTCCTCGACAATGGCAACAACACCAACCACGTAAACGAAGAGTTTG 
ATGTAGACGGCTTTTTAAACCAGTTTGGTAAT 

>retrotransposon_34 568bp Incyte : 1..568; san-like LTR- 113 493 

GATTGTATAGTGGTGTGGTTGATCGACTTCAATATAACAAGAGAGAGATGAGATGAGATGCTTTTATCGC 

GTATATATTTTTTTTTCCATTGACAATTCTGATTTCACAAATTGTTCGCTATAGGGTAGGTCTTCCAAGC 

TAATTTTACCCGACACAAGATGAAATATTTTCTGTTGAGCACTCGTTGTCGACAGTGAAAAATTTTCACT 

CAAGAAAATATTTTATCATCACTTTTTCTAGAATGGAGGTTCAAGTGTTGGAGAATAGACAGCGAACACC 

TGATATTCCCAAGGTCGAATTAGATTGAAAGATAAATAATAGTCATATTTATTTTGTATTTAGTCAATAA 

ATTATCTTTTTATATTTAAATTCTTAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCACAT 

TTAACATATATTAAGCACCGATTACCTGTGACATTCCGGAGTTTACTGTTTCGCGCACGCTGGCAGACGA 

ACAGATTAGAAGCTTGGTAAATCTTTGGTTATTCATCACGTCTTGAGAATAATACAAAGTTTAATATAGT 
ATTTTCAA 

>retrotransposon_35 946bp piiblic: 1..946; san-like LTR: 113.. 493 CTA2 
(transcription factor) C-terminus: <632..946 

GATTGTATAGTGGTGTGGTTGATCGACTTCAATATAACAAGAGAGAGATGAGATGAGATGCTTTTATCGC 

GTATATATTTTTTTTTCCATTGACAATTCTGATTTCACAAATTGTTCGCTATAGGGTAGGTCTTCCAAGC 

TAATTTTACCCGACACAAGATGAAATATTTTCTGTTGAGCACTCGTTGTCGACAGTGAAAAATTTTCACT 

CAAGAAAATATTTTATCATCACTTTTTCTAGAATGGAGGTTCAAGTGTTGGAGAATAGACAGCGAACACC 

TGATATTCCCAAGGTCGAATTAGATTGAAAGATAAATAATAGTCATATTTATTTTGTATTTAGTCAATAA 

ATTATCTTTTTATATTTAAATTCTTAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCACAT 

TTAACATATATTAAGCACCGATTACCTGTGACATTCCGGAGTTTACTGTTTCGCGCACGCTGGCAGACGA 

ACATCAACTCATCTTTTATACAATATATTCTTACGATTATAACTTTCAATTAAGAAATACAACTTCTTAT 

TAGCATTCTCCTACAAGTTCTTAAGTTCCTAGGAAATTCTTCGAAACTATAATTAAAGACGAAAAGTGTA 

AAACAAACAGAAAGCAGAGGAGGCCAAGAAGAAAGCAGAGGAGGCCGCCCCACAAAAGTTTGACAACTTT 

GACGACTTTATTGGCTTTGACATCAACGACAATACCAACGACGAAGACATGTTGTCCAACATGGACTACG 

AGGACCTAAAATTGGACGACAAAGTACATGCCACCACAGACAACAACTTGGACATGAACAACATACTTGA 

AAACGACGAGCTGATACTAGACGGGTTGAACATGACATTGCTCGACAATGGCGACCACGCAAACGAAGAG 
TTTGATGTAGACAGCTTTTTAAACCAGTTTGGCAAT 

>retrotransposon_36 951bp Incyte: 1..951; san-like LTR: 389.. 769- POL 
protein: <1..321 

GATTTGAGAAATACCATTGAAGATCTAGAGTTAAAAATAAGGAATTTGCATGTACATGAGGATAATCAAG 
CGGTCATTACAATCTTAAAGAATGATAATTTCCACCCACATAGACCGATTGATATATGTTACAAATTTCT 
CAGACAAAAATTGAAAGATGGATTTTTTTCAATATCATATGTTGAATCTGGAGATAATTTAGCTGACTCA 
TTCACGAAAGCTTTAGGAAGAAATAAATTGATTGAACATACCAAAAGGATTAGAGAAAGAAAGGATTATG 
ATAATAATGCTACACTGATAGTGGACGTTAGGACGCTCGAAGAGATTAAGATAAACAAGAAATTGGTACA 
TCATTAATTAATTTAGCTGTTTACCTGAATCAGGGGAGTGTTCGCTATAGGGTAGGTCTTCCAAGCTAAT 
TTTACCCGACACAAGATGAAATATTTTCTGTTGAGCACTCGTTGTCGACAGTGAAAAATTTTCACTCAAG 
AAAATATTTTATCATCACTTTTTCTAGAATGGAGGTTCAAGTGTTGGAGAATAGACAGCGAACACCTGAT 
ATTCCCAAGGTCGAATTAGATTGAAAGATAAATAATAGTCATATTTATTTTGTATTTAGTCAATAAATTA 
TCTTTTTATATTTAAATTCTTAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCACATTTAA 
CATATATTAAGCACCGATTACCTGTGACATTCCGGAGTTTACTGTTTCGCGCACGCTGGCAGACGAACAC 
AAATGCTTGAACTATCTGCCGACTTTTTTTTATTTATGGCGTGAGACATTGTTCTCGCACACGGTTGTGA 
TTTATCTACCAGGCTCTCATATTTAGAGCGACAACTACTTTGAGCAAGCAAAACGCATATCTCACCACAC 



ACCAATTGTAGGCTATTCTCAACCGGAAAGTACAACTAGCA 
>retrotransposon_36 POL protein I07aa 

DLRNTIEDLELKIRNLHVHEDNQAVITILKNDNFHPHRPIDICYKFLRQKLKDGFFSISYVESGDNLADS 
FTKALGRNKLIEHTKRIRERKDYDNNATS IVDVRTLE 

>retrotransposon_37 9850bp public: 1..9850; san-like LTR: 369. 769- CTA2 N- 
terminus: l..>234, GAG protein: 939.. 1853, POL protein fragment 1- 
1896.. 2360, POL protein fragment 2: 2509.. 4893, POL protein fragment 3 
(reverse transcriptase): 4953.. 5723 

CTAATCCAAAAATCCATAACCCAACTGCTCAACGGCGAAATCCAAAACTTCCATGCTATTCTAGACCAAA 

CAGTGTCGAAACTCAATGATGCAGAGTGGTGTCTCGGCGTTATGGTTGAAAAGAAAAAGAAACTTGACGA 

ATTGAAAGTCAAAGAAGAAGCGGCAAGAAAGAAGGAAGAAGGGGCAAAGAAAAAGGAAGAAGAGGCAAAG 

AAAAAGGCAGAGGAAGCGAAGAAGTGTTTTATTTTACTTTTCTGTCAAATTTGCACTACTTTTAATTTGT 

GTGCAAATATTCTATTTTACTTGATTTTTATATACTTTTATTTTACAATACTTTTTTATAGGACTTTTTA 

TATCTTTTCTTTATCAACTGTTCGCTATAGGGTAGGTCTTCCAAGCTAATTTTACCCGACACAAGATGAA 

ATATTTTCTGTTGAGCACTCGTTGTCGACAGTGAAAAATTTTCACTCAAGAAAATATTTTATCATCACTT 

TTTCTAGAAGGGAGGTTCAAGTGTTGGAGAATAGACAGCGAACACCTGATATTCCCAAGGTCGAATTAGA 

TTGAAAGATAAATAATAGTCATATTTATTTTGTATTTAGTCAATAAATTATCTTTTTATATTTAAATTCT 

TAGTATTGTCATACCACGTAGATTGATACGGACATACTTAGCACATTTAACATATATTAAGCCCCGATTA 

CCTGTGACATTCCGGAGTTTCTTGTTTCGCGCACGCTGGCAGACGAACAGATTAGAAGCTTGGTAAATCT 

TTGGTTATTCATCACGTCTTGAGAATAATACAAAGTTTAATATAGTATTTTCAAATTTTGGAATACAAAA 

GTTGCTAATTGGTAAATAAGTTATTGATTTATTTCATAAATCTTTTTTGGTATCATATTTCAAAGAGTTG 

CAATTGAAAGCTAAAGACATCCTTATAAATGGCTGAATTTAGCGATGCTGAGCTCAGAAAGATGATGGGT 

ACACTTTCACTCTTGGTACAAGATTCCAGGAGAGAAATTAACCACTTGCATGATAAGTTGGAGAACAATA 

GTGACTCAAAATATCAATCTTTAGAAACGTACATCAACTCAAAGTATGCAGATACTATAAAATCATTTGA 

AAAATTAAAATATTTGGACATTGATAATTCAGAGTTGGTTAATACCTGGATCATGTGTTTTAATCAGGTT 

AAAAGGTTTCACCCTCAGGTTTTTGATGCTTTCATGGAGGCAGAGAACGAGGACGAAATTGGAATCGAAA 

AGATCCAATATACGCCATACACAGGTAAACACTTGAATGATATGATCAGAATCTTCTACATGAAGATATC 

CGAATTAATAGAAAGAAAAGTTAGTCCAAATGTTTCTAGAGAGATGAATGATGGACAGCCACAATTTGTT 

CCGAATTTGTTTAAAAAAGTTTACGAGATGATTATTTCAAAACCAGATGTTTCTGCTGCTGAAAGAATTG 

GAAAAGCTCTTTTCAAGTTACAATCTAAACTGAGAGAACTTGAAAGAGAATCAGCATTTTTGTTATGTCA 

ACATTTAATGACCAATGACCACCAGCACGATGATATTATTCTTAAATTTCTCGTTAGCGGTGTCTCACCA 

TGGTACTTACATCTGCAAATTTACATGCTGTCATATAAACTTGGATTCTCAAATTTGTTTTTAGAGATTT 

ATGCTCAACATTATGAATTGTATAAAGCAGATCCCATTTACAAATTGCCAGATAGTATGACATTGTTGAA 

TGAAATAAGATCAAATAGAGATTATCCTAAAGTGGTAAATGCTGCAAAAAATACAGTACAAGTCAATAAT 

GTTTCATCCAAGAACAATAAAAAGAAGGATGAATGACAACAATTAGCCAATAAAATTGAGGAAGTAGGAC 

GTTATAGCGAAATAAACGCAACATCTACATATCATGAAATTGGCGATACCAACAAAAACAAAGAACAATT 

AATATTGAATTTGAAAAATCATACAAAATTAAGTGAACAAAAGAAGAAAACAAACCTATTGGTATATGAT 

CTGGGAGCCACAGTATCCGTGGTGAATGATAAGACTTTACTTAACGACATTAAAGAATCAAATATCGAAA 

TTGCAACTGCTGAAGGGGAGACATCTACGGCTTATGCTTTAGGTACTCTAACCATATCTGTGAATGGATT 

GAATGCGAAATTAGATGGTGTTCTATACTTGCCATCTATTCAATTAAACTTAATATCTATAAAACAATTT 

GAAGATTTATGCTACGCAATTTTGATTTCCGAAAATCTAATGTGTCTAGTTCACAGTGACCACGGACCTA 

CGGTCATTGCGAAATATTCACCTAAAGATGACTTATACTCAGGCCCAAGATCGGGAACCTTTTTTTAAAA 

GAATTCATAATGACCAAACCCATTTTTTGCTTGCCNCTGCTAAAAAACTTTTAGAATCAGAGACCATATT 

TCTGGAGAATCCCTGAAAAATCCAATGGATTGATCAAGAAAAATTAGATCCGTTGAAAATGACCAATAAA 

GTAGAAAGAGTTACCTATGTCAGCATACGCAACATCAAACAAGAAGTGGCAGACAAATATATGATAAAAG 

ATCTTTACTACTATCATTTATTAATTAATCACCTTTCACATGAAAAACTACAATTATTAGTAAAAAGGGG 

AGTGATTAAACCAGTCAAATCTACTTCGGCTGAGTCGGCCATTTTAAATTGTCAGATATGTGTTGCAGCC 

CATGCAAAATTAGCTAGCCATAATCACACTCAACAACGGGAATTGGAGCGACCATTACAACGCCTCCATT 

TGGATACCGCCGGACCATTTACCTCAAATAAAACTAAGAGCTATCTTACAACCGTGATTGATCAATTTTC 

CAGATATACTGAAGTTATTGTATCTGACACCAAAGCAGTCAAACAAAGCATATTGCATAGACTTAGGGTC 

TGGAACAATAGATTTCAGTTTAAGATCGCGGAGATAAGATATGATAATGCATTGGAGTATCCATCGGCTG 

AGGAGTTAGAGGAGTTAGGAATTTATAAACACCTTCTCCCAAACTACTCTCCTATGCTTAACGGTACAGC 

TGAAGCAACCAACCGCCCCATTGTCCAAGGTATTTATAAGGTAGTGTTAAATTTTAGTTGTCAAGTATTA 

ATACTTTTCCCATTTATAGTGGAGTATGCGGTTCATATCCGGAATCATACACCTATAAAAGAATTTGATG 



GTGCTACTCCTTATGAACGTTACTATGGTTTATCTAAATACGTCATACCATTTTTTCAGTTTGGAACCGA 

CGTTTTGATAAAATGTGCTAGTGTACAAGAAGCTATTTCATTAAAACTACCATCTTCAAGAGATAAAGCT 

TTTCCTACAGTGATGTTTGGTGCTTTTCTCGGTTACGGCTCAGATTCCTTTACCTTCAGAGTTTTAGTTT 

CCACGAAAGGATATCCAGTTATTACAACATCAAACATCCGTCCAATAGCGACGATGCAAGTACTCAATGA 

CTATTTGGCATACATATCGGAGAATAGCTCAATAAGCTATGACGATACATTCTTATCACCTTTGAATCAC 

CCAATGATTCGCACAAACCAACATGATAGACGTGGAGACAATATAAATGTCGAATATGAAAACCGTCCAA 

ATGTACCATTTGAATATCATGCTGAACCTCCTCGTACAAATTCATCGACGGGAATTATCGATCGACCAGA 

TATTAGACCTAGAGCTGATCCCACCTGGCAACGTATGCCTGATGCCAACATACATCAGGAAACAACAACT 

GTACAGACTCCTGATCATGGGGAGTTAGATACCATGATCAACAACGAACACCAACTACCACGATCTGGGG 

AGGGTAATTACCCCGGGCAACAGGTGCGCACCGATATTATTGGGCAATTTCGAGATCGCGGGCCTACCAC 

TCTAAACACTCCGATCGATCTAGGTGTACCCGATGAAACAGACGATATTAGTATGACATCAGAGAATCCA 

ATTGATTCCCCAAATTCCGAGATGATCATATCCCCATCTTTACCCACAAATGAATTGGAACATCAAATCG 

ATATCAGTTCAGGGGAGATGTCGTTATTGCAAACGAATATGGAAGCAGATAACGAATTGAAAACAAATGA 

AATGGTATTATACAAATCAAAAAATGATGGTATTATCATTCAACAACAACAATTCACTGAAAATTTGTCA 

GATGAAAATGAAGAAGATTCATCAACAGATGAGGAAACATTGGAAGACAAAAAACAACAGCGATTGGAAT 

ATAATATTTCACCAAACGATGAGTGGATAAATAATGACGTTCAGAACGAAGATGACACACAAGTGCCACA 

TGTTAAGGAACCAATCAATTATGAAACTCAAAGTAGAAATGAAACAAACATGCCACGAATTGAAATGGGC 

ATAATAGAAAACTTAAGTGATGATGGAAAGAATACACCACGTGAATTACGTATCGTCACCTACGATAATA 

ATAAAGAAATTGAAAAGTACCAAGACAGTAATATCGAGATCCTGGAACCCAGAAACGAAAATGAAAACCA 

GACATTCATTGAAAGCAACTTAGAATTACTTGACAATCAAGAAATGTTTCAAGAAGATCCTCAAGTTGAA 

GATATTCGATTGACAACTCCAAAAAAGGACAAATCGTTATCACCTGATTTCAATCAAACCCATAATGAAA 

TACAACTATTCATGGCAGATATCAATGAAGATATGCTAGAAGAATATGATGAAAATATAAATATGAATGA 

AGTGTTAGCTGACTCCACGGAGACGTTGGACAAAGAATTAGATTTAGATGAAGAAAGTGGAAGGATCGAA 

TATATTGCTGATAGAGTTAGAAAAAAGACAGAGGTACTGATGGTGCGCCACACGGGAAATATTTAAAGAA 

AAATGATAAAGATTTTGGTTCAATAAAAAGTCAGAAAAAATCTGACGCACAAATGGATGATGAAGTTGGA 

ATTGCTATTTCGAAGATCAGAAACTTTCCATTTAGATTGAAGGATGGACGAGCAAGTTTCTTCCCTCCAT 

ATAAAACAAAATTTGGAAGATCAGTGCATCCACCTAAAAGATATTTAAATGCCATTGTTAAGAAAATAGA 

TTACAATCAAAAAGAATGGCGTCAAAGTATGGAAGAAGAAATCGAAAAATTTAAGGCTAACCAAGTTTAC 

ACCGTTGAAAAAACACCAAAGAACGTTGTCCCATTGAAAACCATGTGGGTACATACTTACAAAACCAATG 

ACCTCAAAAATCATAATTACAAAAGCCGTTGCGTGGTAATGGGAAACTATATGGTCGAAAATCGTGATTT 

TGATCCCCATGCCATCTCCTCCCCGGTAGTAGATCTCACAAGTATACGACTATTATCTGCCATAGCTGTT 

GAAAATAACTTGGTTATGCACCAATTGGACATCGCCTCAGCTTATTTGAACGCCAGTTTGGAGGATGGAA 

GAGTAATCTTTGTGAGACCACCGCGTGGTTTTGAGGTTAAACCTGGCTATAGTTGGCGTTTACACAAGTC 

TGTGTACGGTCTTAGGCAGAGTGCCCATAATTGGTACTCACATTTTAAGAATGTGTTGGAGGCAAATGGT 

TTAAAACAAACACTACACAATGATGGCATTTTTTGGAAAAATTATGAAAATGGAGATGTATTATATGTGA 

GTGTATATGTGGATGATGTTTTTATCAAAGCGAATTCAATGAGTTTGTGCAACTAAATTTAGAGTTGCTT 

TTAGTTTACTAAACAAATTTTATCCTTGCTAATCAATACTATCTATTATGCACGATCTAGCAACCTTAAA 

ACAACCAATGGAAAAATTAAAAAAATTCCCTCATCAATCTGGCATGTTCGAATTGAAAAAAAAAAAAGAA 

AACAATAGAAATTCAATACAATAGAGCATAGAACTGGCCAGAATGTGAGACAATAAGTCAGAACAAGTGA 

TTGCCAGTATAGGTAGGGAGAAGCAACAAAGAGAGTTTACACAGCTGAAAACAATCATATCGACGGTTAT 

TGCAACTTGGTTGCTATTTCAACTATTCGTAATGGTCCCATTTTTAGCCAACACAATTTCAGAGAAGACG 

CGAAAAAGGACTTGGAAACTTCATAGTTTAGAGCCACAAACTATAAGAAATAATAGTACGATCTAAATTG 

GTTCCCTAGGATAATGCCCAACAAAGAAATCCCCCAAATAATTGTAAATTGTTCAACCTTAGTAACTCTA 

TCTAGCATTGCGGAGTTCCTTGAAAATGAATTGGTTTGGTGTTCCTACCTGTTCAGTACTTAATCACTAA 

CTAGACAAATTCTTTGGCGAAAGCTCAACTTTTGTGAAGGTCTTTCTCTACTATGAACATGACTCCCAGC 

AAGTCTAGGTTTGGCTGCACTATGAGTTTAATTTAGTTTTATCGGGCTAATACTACTTATTTCCGTTATC 

GGTGTGACCCCCGAAGAAAGGGTATTACGGGGCTCATAATTTTTTTTTTTTTGGCAAGTAGAGTGAGATT 

CAAAAAAGAAAAGTGAACCAGAGCAATAATTGCTATTAATTTTAGTTTTTTACTCACTAGCTATACTTGG 

CTCCCAAACTGATTTTGTAACCCTTTGAGCAAGGTTGTTGGTCAACTGCAAGATCAACTAAGCAAGATCA 

CGCCTTATACGCAAGCCCTGCCAAAAAATAATTCACTCTTGAAACAAGGAATTAGCAGCTATTAGGTAGA 

CTTTTTTTTGTACCTGTATTTCGTTACCAACACTAACCGAGGCACTACCCAAACTCATATAAACATGACT 

AAGAGAAAACAATAGAGAAGGGGTTTAGTTGATTTTCCAATACATTTTAGTGCTGAATTACATTTATCTA 

TTTAGTTTAGTTCCATAATCTTTCTAATATTGTTGAACCATTAGCAAACTTTTTAGATTAAAAGCTCTTT 

TGTAACTGTTTTTTTTCTGTAGTTATCGCGTAACCTTTCCCCCTCAGAATTTCTAAACCCTCCCCCCCCT 



TTCTTCAAAACATTAAAGACTTTGAACTTTATCATCACCACAAAAACTTATTAAGCTCCAGCAAATTTCA 

GGTGACACCAAGGAAAACAACAATTAACATTCTTGGAGTTAAGAGTATATGCTGGTGCATGGATTAAATA 

TGCCTGTTCTTAACCCCAGCGAAAAGAATATGTTATTTTTGAACAAAAAAATAGAATATCTCAAATAAAT 

TTGTTCTCCCCTTTTGTCTATCTATCCCTTTAGCTTTTTGCCAAATTCCAACACAAAATGCTTTAGTCTG 

CAGAAATGATGACTAAAATATTCCTTTTCTTCAAAATTCATATTTTCAAAATTTAGCAAATGGTTGTACT 

AGATATCAGAATTTTATCTGGTGAGTTTACTCAACCATAGTAGTCTTTTTTTAGATCAAAAATTAGACTT 

ATGAACCCTATATTGAATAAAGTTAGTGTTCCCCACAGCTATTCATAATAAAAAAGCTTAACAAAAAGTT 

GAGATTATCAGCGACGATCGATCATGTCGTTCCAGAGATTGTGTTATAGCGCCTCCTTATGAACAGGTAA 

ACTATTAGTTGCATGTAGATCTATTGTGTTCAAATTTAAATTTTAAGAATTGTTAGCTCAAAACAAAGAC 

GACCTGAAATTCCAAAAATCATAAAGTTTACCCCCAAAAAAGTAACGACAATAAAGGTGCACCAAGAAAT 

AATGGTTGTAGTTTTTCCTTTATCTGTTTTAGATTGCTTTATTAGGGGGTATCACTAATTAGCAATTGTA 

GCCCTTGCTCGTTATTGTTGCTTGATTTTTTCTAAAAACATTTGCTTAGCATTATTGTTGTAAGACATAT 

TTATCTATTGTTTCTCACCCTTTTAGACAAATGATTAGCGCCCCTTGACACGATCACAGCCTATTGTTTG 

GTGCACTATTTGAGCTTTAAAGTACTAACTTGTTTTCAGACTATCAATCTATGTGTTTGTTCAAAGCCAG 

GCACTCGAGTCATTAGTCAACAATAGGCTGTATGTTGCTATCCATGTAGTGCCTTGTCTACAGAAATTTG 

CTTTTTTAATTCACAAGCATGAGATTTTTTGTTTGTGTGGTATTTGACGTAAATGTAACATGATTACTTG 

AAATTCGATACGATCTTTTTCGTCGTCTATACAAAATTTATCAAGTGCTACTCTGTGATATTTTGCAAAA 

CCAATCTCATTGTTCCTTGCATGAGAATGATTTCGTTGTCATCAAAGAAATATAAGCTTTCATTACCACA 

ACAAATAGCACATGGTACTACCTTCCCAATTAAAGTATGATGTAACCGTCGTTGTCCCCTTATGTCAAAT 

GCAAAGTGAACATTCAAACTTAAATGCGAGCAAGAGCAATTATAATATTACTTCTTCTAGCTTTACAAAA 

TAATATTTTCATCATTTCTGAGTTTATTAGTAGAAACGTTAATATTATTTCAGAAAAGACTACAATAAAT 

TATTGGGGTAATTCTTAGCGGTAGGTTCTCCTGCCCACGAGTGCTTTGCACTGTAGGTTAAATTTATTTC 

TTCAGGATATTCCTACCCCTCTAGGTTGTACTAACCATTGATAATTACTTGCAAATATTTTTTTCAAAAA 

AAGAAAACCCTTTACATAAATAAGCTTTATATAATTATACGTTGAAAAATGACCCTAATTAGTGTGCAGT 

TTTCAAATCTTAAATGTTTCTCTACCCAATGATTACAGAGATCATCAACACTTGTGAATGGACATCATAT 

CTGTACGCTTTTCTAGGCTGCGAAATTATGTAACTTCTTGGTGTACAAAAAATTGCAACCCCTAAGAAAA 

TCATAAGTTTATATCCAAGAAAAAAATGGTTTATAAGCGTATAATGAAAATAATAATATTATTAACCACG 

ATGGCCAAAAGAAATCTAAAGTTGGCAATAATTCGCTAGTTGGGGGGAAGTTGCCAATAATAAATGAGCA 

GGCGTTTTGATATTTATAATAATAGGTCACCTGTTTTGAGTATTTCCTACAGGGACTTTTATTTTCATAA 

GGTGGATATGCTATCACTTGGTGAAACAACTTCAAATTCGTGTACTTTGCTTATGCCAGATACTTAGCAC 

TGGGAAATTGTTACAACCCCATTTCTGGAAATGTAACGTCACCTGAAACCATCTTATGGTCCTGCCATTG 

GTGTTTCATCGTGTTACAATGCTAGGTTTTTTAAATGTCTACAAGTCAATATTATATTCAAGATAAACTT 

TTCAAAACATCTGATTTATTATGACATTATTCTTGTTGACATTTTTTTGGGGTAGACAAGAAATAATTGC 

AGATAATATAGAACACTTATGCCACGTGGGTGGATTTAATAGAATCCTTGTAAAATATTATCTCTAGAGA 

ATTATAAGGGGAGGAGAGAAGATCTATGGCAATGCAAGAAAATGCAAGATCATCGTAAAAAAAGTATAAG 

AATGACTCCATAAGATATATAAACCCACTTGTTTGAAGAGCGCTTACTACACGGGGTTGTCTTAATACAA 

AGGCGGCAGGGTTGCAGTACTTCTGTAGTTTCTAACCTTTGTATTCCTTAGGCCCTGGAATATAATACTT 

CCTGTAGTAAATGTCGGAGTTTAAATTGCTGACATTGCAAGAAAATAAAACCAATATAATATTTTTTATG 

TCACGAAAGAAATGGAACAACAATGTAGCACCAAAAGGGGTAGAGACTAGGCAGTACTATATTTGGAGGT 

AAAAGTATATTAGAAAAAGAACCTATACATGAACCAGTAACCATAACAAAAAAAAACTAAACCCAAGCAA 

TTAACCATCCAAATTTAACCCGTTTTATAATACAATTTTGACCACATCTA 

>retrotransposon_37 GAG 305aa 

MAEFSDAELRKMMGTLSLLVQDSRREINHLHDKLENNSDSKYQSLETYINSKYADTIKSFEKLKYLDIDN 

SELVNTWIMCFNQVKRFHPQVFDAFMEAENEDEIGIEKIQYTPYTGKHLNDMIRIFYMKISELIERKVSP 

NVSREMNDGQPQFVPNLFKKVYEMIISKPDVSAAERIGKALFKLQSKSRELERESAFLLCQHLMTNDHQH 

DDIILKFLVSGVSPWYLHSQIYMSSYKLGFSNLFLEIYAQHYELYKADPIYKLPDSMTLLNEIRSNRDYP 
KWNAAKNTVQVNNVS S KNNKKKDE 

>retrotransposon_37 POL fragment 1 155aa 

SEINATSTYHEIGDTNKNKEQLILNLKNHTKLSEQKKKTNLLVYDSGATVSWNDKTLLNDIKESNIEIA 

TAEGETSTAYALGTLTISVNGLNAKLDGVLYLPSIQLNLISIKQFEDLCYAILISENLMCLVHSDHGPTV 
lAKYSPKDDLYSGPR 

>retrotransposon_37 POL fragment 2 795aa 

MTNKVERVTYVSIRNIKQEVADKYMIKDLYYYHLLINHLSHEKLQLLVKRGVIKPVKSTSAESAILNCQI 
CVAAHAKLASHNHTQQRELERPLQRLHLDTAGPFTSNKTKSYLTTVIDQFSRYTEVIVSDTKAVKQSILH 



RLRVWNNRFQFKIAEIRYDNALEYPSAEELEELGIYKHLLPNYSPMLNGTAEATNRPIVQGIYKWLNFS 

CQVLILFPFIVEYAVHIRNHTPIKEFDGATPYERYYGLSKYVIPFFQFGTDVLIKCASVQEAISLKLPSS 

RDKAFPTVMFGAFLGYGSDSFTFRVLVSTKGYPVITTSNIRPIATMQVLNDYLAYISENSSISYDDTFLS 

PLNHPMIRTNQHDRRGDNINVEYENRPNVPFEYHAEPPRTNSSTGIIDRPDIRPRADPTWQRMPDANIHQ 

ETTTVQTPDHGELDTMINNEHQLPRSGEGNYPGQQVRTDIIGQFRDRGPTTLNTPIDLGVPDETDDISMT 

SENPIDSPNSEMIISPSLPTNELEHQIDISSGEMSLLQTNMEADNELKTNEMVLYKSKNDGIIIQQQQFT 

ENLSDENEEDSSTDEETLEDKKQQRLEYNISPNDEWINNDVQNEDDTQVPHVKEPINYETQSRNETNMPR 

lEMGIIENLSDDGKNTPRELRIVTYDNNKEIEKYQDSNIEISEPRNENENQTFIESNLELLDNQEMFQED 

PQVEDIRLTTPKKDKSLSPDFNQTHNEIQLFMADINEDMLEEYDENINMNEVLADSTETLDKELDLDEES 
GRIEYIADRVRKKTEVSMVRHTGNI 

>retrotransposon_37 POL fragment 2 {reverse transcriptase) 257aa 

MDDEVGIAISKIRNFPFRLKDGRASFFPPYKTKFGRSVHPPKRYLNAIVKKIDYNQKEWRQSMEEEIEKF 

KANQVYTVEKTPKNWPLKTMWVHTYKTNDLKNHNYKSRCWMGNYMVENRDFDPHAISSPWDLTSIRL 

LSAIAVENNLVMHQLDIASAYLNASLEDGRVIFVRPPRGFEVKPGYSWRLHKSVYGLRQSAHNWYSHFKN 

VLEANGLKQTLHNDGIFWKNYENGDVLYVSVYVDDVFIKANSMSLCN 

>retrotransposon_38 3159bp public: 1. .2084, Incyte: 2085.. 3159- san-like 
. LTR: 2638.. 3019 

AATCTGTCCACCTCGTTTTGAGAGGTTCTCAAAATTCTTTGTAATTTTCAAACTTCACCTTTGGCTTTGT 

AAAGTTGGTTTTTTAAGGAATAGCTTTGATTATTTGACATTGCAAACAGTATAGTCAAGATGCACACAGA 

TTGGACCTGAAATTATTCCTTCGCAAAAACTTAAAATAACCCAAATATTAAACATCCACTCGGATTCAAA 

TACCTCAGCACTCTTTTATAGGCACTTGTATAATTTGTTATATGAATCATTTCCAGCTTCCTTGTAGAAC 

CGCCAAATATTTGAATCACATGGGAAACAGATTTGACCATCTAACTTTCATGGTTCTTATGAAAAAGATC 

TGGAAATGGTGATATAGCTTGATTGTCTAGCATATTCAGCGATTACCCTATTTTGTGGTTGCCTGGGATA 

ACCCCTGGCTGTTGTTGGAAAAGACTCGTGACAAGTATTTTTGCCCACGAGTTTCTAATTACTGCGATAT 

TATCCAGTTACATTTTCGCAACTCGTTCTACTTGAGCTCCTTCTATGAATCAACTAGCTGGCTATTTCCC 

TGGATAGAAAACCTTCATTCTTCTTCTCCTGGTTGAGTATCACCGACTTGTGGCCGTACCGTTCAACCCC 

CTACAATACACCATCAACTTTATACTTGTAATACTCGGCTTTGCCACTCCCCAAACTAACCACTATAAGT 

TCATACTCCTTGGCTTGCTTGACTTTCCTATTTCTTAACCCACTACTCTTCTGTACCACTCCGATCATCA 

GATTGACAGAGGTTACTTCATACCCAACAACATTTTCATACCAGTCGACCTTCTCCTCTGCACCACCAAA 

CCCAACACATCGGATTTCCCTGGGATCTCTCTCAACTCTCAAACATATTGCTTTCTTATCTACCCTGAAC 

GTGTGCACCACTACCACCCCTTCTATCTCATATACCACACTGAACGATGAGATCGCAGCACTCCCACAAA 

ACCGACAATGCAGCGGCTCAGGATACGACACCCTCAACGAGTTCACCTTCATATTCCCGACCCCAAACAG 

TTTGATGACCACCCCCGTGTTCACATCTATAAGCTGACACTCTAACCCGTCAACACGTATAAAGAACCCC 

ACAAACTCAACCGGAAATATCCCACACAGTTTCAGGGGCGCCACCTCTAGCTTTCTGCTCTTCATGCTGT 

TGTTGACGATGTTCACCACAATAATATCCAACTCCTTCGTCTGCACAACAATTCTATCCATCACCCTTGG 

TGTTCTTATCTTTATTGCACAGACCAACTGCTGCTTCACATCATAACTCTGTACTTTCCCATCATTACAC 

GACACAACAAGTATCTCCCCACTATCCATGACCATCACAAACTCTTCCCTACTAGTCCTCTCACGCTGTT 

TCTGTCCAAACGATTTCATCTGTATTGGTGGCGGAAAGTTCGCATTGATCAGCGAATTTACCGACGACAT 

TGACGCATCACTGCCCCTCCTCTTTCTAATCATTTTACGTGCTAAAAACCCCGGCACAGTTCTCCGCCTG 

AAAAACGACTCCAACACTTTACCTCGAAAGTGCACCGACAGTGTCCACTTCAACTCCCGCTTGTCATAAC 

CCTGTATGACACCCTGTCTAGTACTCACCAACACAACCATACTCCCATCATCATTGAGCCCCACATGGCT 

GACCGGCCACATCTGACAGGGTATGGCTAGTGGTTCAGGGTCGTAACAGTACTCGACATCTTGGGGTTGG 

TAGTGATATATCTGAACTCGTATCCATCATATAACTCTTCTCCTCAGCAAACTCAATGGCCTGGGTTTTT 

GCCGGAACCACTAGTGCAACCACCAACAAGAGGTACTCCACATAGTAAATGTACGTGTTAGACTGGGAAA 

CAACCACACTGGTTTGGTCGACTCAGCACGCTATTCATCAACAATACCCCCAACAGAATCACCAAGTTAT 

TTGTCAGCCTCAGTTTGTACTTCCACCACTGACCCCACCACCGCATAGTTCACCAAAAGGGTCTTGCATA 

ATCCACGTCCCACCATATCACTTCAACTCCCATATTCCTCGATGCAAGAATAACCACAATAATCGGCTTT 

CGTAAACGTCGTCAGTGGCTCAAACACATTGCTGCACCTTGAGCTCTAGAACAACCCCACACTCACTAGC 

CATCGCCACACCAACAACCAAATTGCTGATCCAGAAAAAATACCACCCCCGTAGTCCGGCTTGTATGGAA 

TAATTGCTTGGCCAGGTACGTCCCCACCTCATCGTGTCTTTTCTGGTTGAAATATGTCATCTCCCGGGCT 

AACAGTACCGTATCTCTGTGGCTGGGGCATCTATACTCTTTCATTCTCGGCTTACAAATCTATCTTGTTC 

ACACATTTCATATATCTGGGACTTGTCGAACTCTCTGCACTCTATCATAAACTGGAACTCGCTTGCATTC 

TGGGACACACACTGGAGCTGGAATCCATGGTCAGGAAATGTGAAAATTTTCTTCTCGGGAAATATTTGTG 

ACAATTAGTCCTAGTACACGATAGTTTCATTACGCCCACTAAAAGTGTCTACTGAAACTCGGTCTCTATA 



TCGTCAATATCTTTCATTTCTCTTCCTGGCTTTTCACTGCGACTTATTGTTCGCTATAGGGTAGGTCTTC 
CAAGCTAATTTTACCCGACACAAGATGAAATATTTTCTGTTGAGCACTCGTTGTCGACAGTGAAAAATTT 
TCACTCAAGAAAATATTTTCATCATCACTTTTTCTAGAAAGGAGGTTCAAGTGTTGGAGAATAGACAGCG 
AACACCTGATATTCCCAAGGTCGAATTAGATTGAAAGATAAATAATAGTCATATTTATTTTGTATTTAGT 
CAATAAATTATCTTTTTATATTTAAATTCTTAGTATTGTCATACCACGTAGATTGATACGGACATACTTA 
GCACATTTAACATATATTAAGCACCGATTACCTGTGACATTCCGAAGTTTACTGTTTCGCGCACGCTGGC 
AGACGAACACTTATCAAGGTGCTACTCCCGCGCATCAGTTTCCTCTGGGTTCTCTTTTTGATCTTGGTGA 
ACTACCTTTTTTTCCCACTCGCGTGAGAAGTTCAACACTTTTTTTTACCCATCCACCAAACTTTATTCTT 



Name 



'^k n i._ 



AFn4i4fio Kn. r» W W — -^"9*'' (''P) Regions of interest Remarl<s - Novelti 

Aru4i4.ii, (280 bp)^Cano,oa a/o/can^^^^^^^ long terminal repeat kappa, complete sequence 



retrvtransposon^OI 994 
retrotransposon_02 1348 



retrotranspo$on_03 3034 



LTR kappa: 548..927 

LTR kappa: 764.. 1043, 
POL (contains stop 
codons): <136..714 
LTR kappa: 75..354 



AF043301 (5624 bp) Candida 



retrotransposonJ)4 3504 

retrotransposon_05 3955 

retrotransposon__06 1 434 

retrotransposon_07 1 606 



a/f?/cans retrotransposon-like element Tca1, complete sequence 
Tea 1 -like LTR:688.. 1075 



pa/f/a/ sequence present in 
public domain 
part/a/ sequence present in 
public domain 

complete sequence present 
in public domain, identity 99% 



Teal -like LTR: 2656..3043 
Tcal-like LTR: 87..475 

Teal -like LTR: 1046.-1433 



complete sequence present 
in public domain, identity 99% 
complete sequence present 
in public domain, identity 99% 
complete sequence present 
in public domain, identity 
100% 

complete sequence present 
in public domain, identity 98% 



retrotransposon_08 1 385 
retrotransposon_09 1 483 
retrotransposon_10 879 



..uo.. ,0 ^o^^^op) ggga y I ca. ^etrotransposon ^ ^^^^^^^^ (.^g) and pol po,prote,n (po.) genes, complete cds 

I ca^ iiKe LTR. 49..328 partial sequence present in 

-r or. . -r^ « public domain 

Tca2-likeLTR:871..1l50 



retrotransposon_11 974 

retrotransposon_ 12 3868 
retrotransposon_13 469 



Tca2-like LTR: 326.. 605 



Tca2-like LTR: 483..761, 
CTA2 (transcription factor): 
join(<974..>778.<223..>1) 
Tca2-like LTR: 127..407 

Tca2-like LTR: 75.. 355 



''^^i^^^f "^^'l^'^^^^P"-"!^^ ^ever^e transcnptase (pol, gene, partial cds 



retrotranspos6n_l4 4545 

retrotransposon_ 1 5 2093 

retrotransposon_16 2099 

retrotransposon_ 1 7 3284 

retrotran$po$on_18 791 

retrotransposon_ 19 458 1 



complete sequence present 
in public domain, identity 99% 
complete sequence present 
in public domain, identity 
100% 

partial sequence present in 
public domain 

complete sequence present 
in public domain, identity 99% 
complete sequence present 
in public domain, identity 99% 



l^^^T^'. X part/a/sequence present in 

4234..4545, POL fragment retrotransposon public domain 
1: 577„>3324, POL 
fragment 2: <3443..4201 



Tca3-like LTR: 1509.. 1822 
Tca3-like LTR: 1565.. 1878 

Tea3-like LTR: 2750..3063 
Tca3-like LTR: 277..590 
Tca3-like LTR: 2725..3037 



pa/t/a/ sequence present in 
public domain 

complete sequence present 
in public domain, identity 
100% 

part/a/ sequence present in 
public domain 
partial sequence present in 
public domain 
parf/a/ sequence present in 
public domain 



rwL pruiein. rearranged pgrtial sequence present in 

public domain 



M.ut.450 (^^^) 0an6M.^^^^ retrotransposon long tem^inal repeat ze ta, complete sequence 



retrotransposon_21 2027 

retrotransposon_22 2118 

retrotransposon_23 4929 

retrotransposonJ24 4954 

retrotranspo$on_25 1047 

retrotransposon__26 7929 

retrotransposon_27 2292 



LTR zeta: 1384.. 1891 
LTR zeta: 141 9.. 1927 
LTR zeta: 2990. 3497 

LTR zeta: 256..763 

LTR zeta: 314.. 822 

LTR zeta: 3346.. 3853 
LTR zeta: 1327.. 1834 



partial sequence present in 
public domain 
partial sequence present in 
public domain 

complete sequence present 
in public domain, identity 
100% 

complete sequence present 
in public domain, identity 
100% 

complete sequence present 
in public domain, identity 
100% 

partial sequence present in 

public domain 

part/a/ sequence present in 



, 03049838 



retrDtransposon_28i 

retrotransposon_29 2731 

retrotransposon_30 2858 

retrotransposon_31 1636 

retrotransposon_32 2 1 25 



LTR zeta: <794..1294 
LTR zeta: 380.. 887 



LTR zeta: 81 4.. 1321, 
reverse transcriptase 
fragment (contains stop 
codon): 635..>537 
LTR zeta: <595..1098 

LTR zeta: 11 05.. 161 2 



(transcription factor): 
join(974. . >234 , <888. . 1 292) 



retrotransposon_34 568 

retrotransposon_35 946 

rBtrDtransposon_36 95 1 

retmtransposon_37 9850 



retrotransposon_3d 3159 



LTR san: 113..493 

LTR san: 113..493, CTA2 
(transcription factor) C- 
terminus: <632..946 
POL protein: <1..321, LTR 
san; 389.. 769 
GAG protein: 939 . 1853, 
POL protein fragnrient 1:' 
1896..2360, POL protein 
fragment 2: 2509..4893. 
POL protein fragment 3 
(reverse transcriptase): 
4953..5723 
LTR san: 2638 .301 9 



contains also 
POL 

contains also 
GAG/POL 



public domain 

part/a/ sequence present in 

public domain 

complete sequence present 
in public domain, identity 
100% 

partial sequence present in 
public domain 



parf/a/ sequence present in 
public domain 
paff/a/ sequence present in 
public domain 



retrotransposon 37 (see above) 



cds 



partial sequence present in 
public domain 

partial sequence present in 
public domain 
complete sequence present 
in public domain, identity 
100% 

partial sequence present in 
public domain 
complete sequence present 
In public domain, identity 
100% 



complete sequence present 
in public domain, identity 99% 



